Questa pagina è stata tradotta dall'API Cloud Translation.

Dati categorici: incroci di caratteristiche

Gli incroci di caratteristiche vengono creati incrociando (prendendo il prodotto cartesiano di) due o più caratteristiche categoriche o raggruppate del set di dati. Come le trasformazioni polinomiali, gli incroci di caratteristiche consentono ai modelli lineari di gestire le non linearità. Gli incroci di caratteristiche codificano anche le interazioni tra le caratteristiche.

Ad esempio, considera un set di dati a livello inferiore con le caratteristiche categoriche:

edges, contenente i valori smooth, toothed e lobed
arrangement, contenente i valori opposite e alternate

Supponiamo che l'ordine riportato sopra sia l'ordine delle colonne delle caratteristiche in una rappresentazione one-hot, in modo che un albero con smooth bordi e opposite arrangiamenti sia rappresentato come {(1, 0, 0), (1, 0)}.

L'incrocio delle caratteristiche, o prodotto cartesiano, di queste due caratteristiche sarebbe:

{Smooth_Opposite, Smooth_Alternate, Toothed_Opposite, Toothed_Alternate, Lobed_Opposite, Lobed_Alternate}

dove il valore di ogni termine è il prodotto dei valori delle caratteristiche di base, ad esempio:

Smooth_Opposite = edges[0] * arrangement[0]
Smooth_Alternate = edges[0] * arrangement[1]
Toothed_Opposite = edges[1] * arrangement[0]
Toothed_Alternate = edges[1] * arrangement[1]
Lobed_Opposite = edges[2] * arrangement[0]
Lobed_Alternate = edges[2] * arrangement[1]

Ad esempio, se una foglia ha un bordo lobed e un arrangiamento alternate, il vettore di incrocio delle funzionalità avrà un valore pari a 1 per Lobed_Alternate e un valore pari a 0 per tutti gli altri termini:

{0, 0, 0, 0, 0, 1}

Questo set di dati potrebbe essere utilizzato per classificare le foglie in base alla specie di albero, poiché queste caratteristiche non variano all'interno di una specie.

Fai clic qui per confrontare le trasformazioni polinomiali con gli incroci di funzionalità

Gli incroci di caratteristiche sono in qualche modo analoghi alle trasformazioni polinomiali. Entrambi combinano più caratteristiche in una nuova caratteristica sintetica su cui il modello può essere addestrato per apprendere le non linearità. Le trasformazioni polinomiali combinano in genere i dati numerici, mentre le intersezioni di elementi combinano i dati categorici.

Quando utilizzare le intersezioni di elementi

Le conoscenze del dominio possono suggerire una combinazione utile di funzionalità da incrociare. Senza queste conoscenze di dominio, può essere difficile determinare manualmente le intersezioni di funzionalità o le trasformazioni polinomiali efficaci. Spesso è possibile, anche se il costo computazionale è elevato, utilizzare le reti neurali per trovare e applicare automaticamente combinazioni di funzionalità utili durante l'addestramento.

Fai attenzione: l'incrocio di due elementi sparsi produce un nuovo elemento ancora più sparso rispetto ai due elementi originali. Ad esempio, se la caratteristica A è una caratteristica sparsa di 100 elementi e la caratteristica B è una caratteristica sparsa di 200 elementi, un incrocio di caratteristiche di A e B genera una caratteristica sparsa di 20.000 elementi.

Centro assistenza

Indietro

Problemi comuni con i dati categorici (5 min)

Avanti

Esercizi sull'incrocio di caratteristiche (15 min)

Dati categorici: incroci di caratteristiche Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Quando utilizzare le intersezioni di elementi

Dati categorici: incroci di caratteristiche