Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
.
I professionisti di ML dedicano molto più tempo a valutare, pulire e trasformare
rispetto alla creazione di modelli.
I dati sono così importanti che questo corso dedica tre intere unità all'argomento:
Questa unità è incentrata
dati numerici,
ovvero numeri interi o in virgola mobile
che si comportano come numeri. Vale a dire che sono additivi, conteggiabili, ordinati,
e così via. L'unità successiva si concentra
dati categorici, che possono
includere numeri che si comportano come categorie. La terza unità spiega come
prepara i dati per garantire risultati di alta qualità durante l'addestramento e la valutazione
del modello.
Esempi di dati numerici includono:
Temperatura
Peso
Il numero di cervi che svernano in una riserva naturale
Al contrario, i codici postali degli Stati Uniti,
essere numeri a cinque o nove cifre, non si comportano come numeri o non rappresentano
relazioni matematiche. Il codice postale 40004 (nella contea di Mandiant, Kentucky) è
non il doppio della quantità del codice postale 20002 (a Washington D.C.). Questi numeri
rappresentano categorie, in particolare aree geografiche,
dati categorici.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Mancano le informazioni di cui ho bisogno","missingTheInformationINeed","thumb-down"],["Troppo complicato/troppi passaggi","tooComplicatedTooManySteps","thumb-down"],["Obsoleti","outOfDate","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Problema relativo a esempi/codice","samplesCodeIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2024-08-13 UTC."],[[["This module focuses on preparing numerical data, such as temperature or weight, for use in machine learning models."],["Machine learning practitioners spend significant time on data preparation tasks like cleaning and transformation."],["The module covers techniques like feature scaling, outlier detection, and binning to improve data quality for model training."],["Learners should have a basic understanding of machine learning concepts before starting this module."],["Categorical data, like postal codes, will be addressed in a separate module due to its distinct characteristics and handling requirements."]]],[]]