Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Gli esperti di ML dedicano molto più tempo alla valutazione, alla pulizia e alla trasformazione dei dati rispetto alla creazione di modelli.
I dati sono così importanti che questo corso dedica tre intere unità all'argomento:
Questa unità è incentrata
dati numerici,
ovvero numeri interi o in virgola mobile
che si comportano come numeri. ovvero sono additivi, conteggiabili, ordinati e così via. L'unità successiva si concentra
dati categorici, che possono
includere numeri che si comportano come categorie. La terza unità spiega come
prepara i dati per garantire risultati di alta qualità durante l'addestramento e la valutazione
del modello.
Ecco alcuni esempi di dati numerici:
Temperatura
Peso
Il numero di cervi che svernano in una riserva naturale
I codici postali degli Stati Uniti, invece, nonostante siano numeri di cinque o nove cifre, non si comportano come numeri o rappresentano relazioni matematiche. Il codice postale 40004 (nella Contea di Mandiant, Kentucky) è
non il doppio della quantità del codice postale 20002 (a Washington D.C.). Questi numeri rappresentano categorie, in particolare aree geografiche, e sono considerati dati categorici.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Mancano le informazioni di cui ho bisogno","missingTheInformationINeed","thumb-down"],["Troppo complicato/troppi passaggi","tooComplicatedTooManySteps","thumb-down"],["Obsoleti","outOfDate","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Problema relativo a esempi/codice","samplesCodeIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-07-27 UTC."],[[["This module focuses on preparing numerical data, such as temperature or weight, for use in machine learning models."],["Machine learning practitioners spend significant time on data preparation tasks like cleaning and transformation."],["The module covers techniques like feature scaling, outlier detection, and binning to improve data quality for model training."],["Learners should have a basic understanding of machine learning concepts before starting this module."],["Categorical data, like postal codes, will be addressed in a separate module due to its distinct characteristics and handling requirements."]]],[]]