Esplora le opzioni di seguito.

Le diverse città della California hanno caratteristiche notevolmente diverse prezzi delle abitazioni. Supponiamo di dover creare un modello per prevedere i prezzi delle abitazioni. Quale delle i seguenti insiemi di caratteristiche o incroci di caratteristiche potrebbero apprendere relazioni specifiche della città tra roomsPerPerson e prezzo dell'alloggio?
Tre elementi suddivisi in gruppi distinti: [latitudine vincolata], [longitudine fissa], [binned camerePerPerson]
Il binning è positivo perché consente al modello di apprendere non lineari relazioni all'interno di una singola caratteristica. Tuttavia, una città esiste in più di una dimensione, per cui apprendere relazioni specifiche per le città richiede di attraversare latitudine e longitudine.
Incrocio di un elemento: [latitudine X longitudine X roomsPerPerson]
In questo esempio, l'incrocio di caratteristiche con valore reale non è una buona idea. Superare il valore reale della latitudine con stanzePerPerson consente una modifica del 10% di una funzionalità (ad esempio, latitudine) equivalente a una variazione del 10% nell'altra caratteristica (ad esempio, stanzePerPersona).
Un unico incrocio di caratteristiche: [latitudine ordinata X longitudine ordinata X longitudine ordinata X roomsPerPerson]
Attraversare la latitudine fasciata con la longitudine fasciata abilita la funzione modello per apprendere gli effetti specifici della città delle stanzePerPerson. Il binning impedisce una modifica della latitudine producendo lo stesso risultato come una variazione di longitudine. In base alla granularità i confini, questo incrocio di caratteristiche potrebbe apprendere effetti specifici di un quartiere o persino di un blocco.
Due incroci di caratteristiche: [binned latitude X binned camerePerPerson] e [binned longitude X binned camerePerPerson]
Il binning è una buona idea: tuttavia, una città è la congiunzione latitudine e longitudine, quindi incroci di caratteristiche separati impediscono basato sui prezzi specifici per le città.