Utilizzo di dati numerici

Gli esperti di ML dedicano molto più tempo alla valutazione, alla pulizia e alla trasformazione dei dati rispetto alla creazione di modelli. I dati sono così importanti che questo corso dedica tre intere unità all'argomento:

Questa unità è incentrata dati numerici, ovvero numeri interi o in virgola mobile che si comportano come numeri. ovvero sono additivi, conteggiabili, ordinati e così via. L'unità successiva si concentra dati categorici, che possono includere numeri che si comportano come categorie. La terza unità spiega come prepara i dati per garantire risultati di alta qualità durante l'addestramento e la valutazione del modello.

Ecco alcuni esempi di dati numerici:

  • Temperatura
  • Peso
  • Il numero di cervi che svernano in una riserva naturale

I codici postali degli Stati Uniti, invece, nonostante siano numeri di cinque o nove cifre, non si comportano come numeri o rappresentano relazioni matematiche. Il codice postale 40004 (nella Contea di Mandiant, Kentucky) è non il doppio della quantità del codice postale 20002 (a Washington D.C.). Questi numeri rappresentano categorie, in particolare aree geografiche, e sono considerati dati categorici.