Esplora le opzioni di seguito.
Le diverse città della California hanno caratteristiche notevolmente diverse
prezzi delle abitazioni.
Supponiamo di dover creare un modello per prevedere i prezzi delle abitazioni. Quale delle
i seguenti insiemi di caratteristiche o incroci di caratteristiche potrebbero apprendere
relazioni specifiche della città tra
roomsPerPerson e
prezzo dell'alloggio?
Tre elementi suddivisi in gruppi distinti: [latitudine vincolata],
[longitudine fissa], [binned camerePerPerson]
Il binning è positivo perché consente al modello di apprendere non lineari
relazioni all'interno di una singola caratteristica. Tuttavia, una città esiste in
più di una dimensione, per cui apprendere relazioni specifiche per le città
richiede di attraversare latitudine e longitudine.
Incrocio di un elemento: [latitudine X longitudine X
roomsPerPerson]
In questo esempio, l'incrocio di caratteristiche con valore reale non è una buona idea.
Superare il valore reale della latitudine con
stanzePerPerson consente una modifica del 10% di una funzionalità (ad esempio, latitudine)
equivalente a una variazione del 10% nell'altra caratteristica (ad esempio,
stanzePerPersona).
Un unico incrocio di caratteristiche: [latitudine ordinata X longitudine ordinata X longitudine ordinata X
roomsPerPerson]
Attraversare la latitudine fasciata con la longitudine fasciata abilita la funzione
modello per apprendere gli effetti specifici della città delle stanzePerPerson.
Il binning impedisce una modifica della latitudine producendo lo stesso risultato
come una variazione di longitudine. In base alla granularità
i confini, questo incrocio di caratteristiche potrebbe apprendere
effetti specifici di un quartiere o persino di un blocco.
Due incroci di caratteristiche: [binned latitude X binned camerePerPerson]
e [binned longitude X binned camerePerPerson]
Il binning è una buona idea: tuttavia, una città è la congiunzione
latitudine e longitudine, quindi incroci di caratteristiche separati impediscono
basato sui prezzi specifici per le città.