Dati numerici reali
può essere moltiplicato in modo significativo. Ad esempio, prendi in considerazione un
modello che preveda il valore di una casa in base alla sua metratura.
Tieni presente che un modello utile per valutare i prezzi delle abitazioni di solito si basa su
centinaia di funzionalità. Detto questo, a parità di condizioni, una casa di 200 m2
i metri dovrebbero avere circa il doppio del valore di una casa identica di 100 metri quadrati
metri.
Spesso, è consigliabile rappresentare le caratteristiche che contengono valori interi come
dati categorici anziché numerici. Ad esempio, considera una funzionalità di codice postale in cui i valori sono numeri interi. Se rappresenti questa caratteristica in modo numerico anziché categorico, chiedi al modello di trovare una relazione numerica tra codici postali diversi. Ciò significa che il modello
considera il codice postale 20004 come il doppio (o la metà) di un indicatore rispetto al codice postale
10002. Rappresentare i codici postali come dati categorici consente al modello
ponderare ogni singolo codice postale separatamente.
Codifica
Codifica significa convertire dati categorici o di altro tipo in vettori numerici
su cui può essere addestrato un modello. Questa conversione è necessaria perché i modelli possono
vengono addestrate solo con valori in virgola mobile; i modelli non possono essere addestrati su stringhe come
"dog" o "maple". Questo modulo illustra diverse
metodi di codifica per dati categorici.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Mancano le informazioni di cui ho bisogno","missingTheInformationINeed","thumb-down"],["Troppo complicato/troppi passaggi","tooComplicatedTooManySteps","thumb-down"],["Obsoleti","outOfDate","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Problema relativo a esempi/codice","samplesCodeIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-07-27 UTC."],[[["This module focuses on differentiating between categorical and numerical data within machine learning."],["You will learn how to represent categorical data using one-hot vectors and address common issues associated with it."],["The module covers encoding techniques for converting categorical data into numerical vectors suitable for model training."],["Feature crosses, a method for combining categorical features to capture interactions, are also discussed."],["It is assumed you have prior knowledge of introductory machine learning and working with numerical data."]]],[]]