Gli incroci di caratteristiche vengono creati incrociando (prendendo il prodotto cartesiano di) due o più caratteristiche categoriche o raggruppate del set di dati. Come le trasformazioni polinomiali, gli incroci di caratteristiche consentono ai modelli lineari di gestire le non linearità. Gli incroci di caratteristiche codificano anche le interazioni tra le caratteristiche.
Ad esempio, considera un set di dati a livello inferiore con le caratteristiche categoriche:
edges
, contenente i valorismooth
,toothed
elobed
arrangement
, contenente i valoriopposite
ealternate
Supponiamo che l'ordine riportato sopra sia l'ordine delle colonne delle caratteristiche in una rappresentazione one-hot, in modo che un albero con smooth
bordi e opposite
arrangiamenti sia rappresentato come {(1, 0, 0), (1, 0)}
.
L'incrocio delle caratteristiche, o prodotto cartesiano, di queste due caratteristiche sarebbe:
{Smooth_Opposite, Smooth_Alternate, Toothed_Opposite, Toothed_Alternate,
Lobed_Opposite, Lobed_Alternate}
dove il valore di ogni termine è il prodotto dei valori delle caratteristiche di base, ad esempio:
Smooth_Opposite = edges[0] * arrangement[0]
Smooth_Alternate = edges[0] * arrangement[1]
Toothed_Opposite = edges[1] * arrangement[0]
Toothed_Alternate = edges[1] * arrangement[1]
Lobed_Opposite = edges[2] * arrangement[0]
Lobed_Alternate = edges[2] * arrangement[1]
Ad esempio, se una foglia ha un bordo lobed
e un arrangiamento alternate
, il vettore di incrocio delle funzionalità avrà un valore pari a 1 per Lobed_Alternate
e un valore pari a 0 per tutti gli altri termini:
{0, 0, 0, 0, 0, 1}
Questo set di dati potrebbe essere utilizzato per classificare le foglie in base alla specie di albero, poiché queste caratteristiche non variano all'interno di una specie.
Quando utilizzare le intersezioni di elementi
Le conoscenze del dominio possono suggerire una combinazione utile di funzionalità da incrociare. Senza queste conoscenze di dominio, può essere difficile determinare manualmente le intersezioni di funzionalità o le trasformazioni polinomiali efficaci. Spesso è possibile, anche se il costo computazionale è elevato, utilizzare le reti neurali per trovare e applicare automaticamente combinazioni di funzionalità utili durante l'addestramento.
Fai attenzione: l'incrocio di due elementi sparsi produce un nuovo elemento ancora più sparso rispetto ai due elementi originali. Ad esempio, se la caratteristica A è una caratteristica sparsa di 100 elementi e la caratteristica B è una caratteristica sparsa di 200 elementi, un incrocio di caratteristiche di A e B genera una caratteristica sparsa di 20.000 elementi.