Superare l'attraversamento?
Prima di guardare il video o leggere la documentazione, completa questo esercizio che illustra l'uso eccessivo delle intersezioni delle funzionalità.
Attività 1: esegui il modello così com'è, con tutte le caratteristiche
tra prodotti specificate. Ci sono sorprese nel modo in cui il modello si adatta ai dati?
Qual è il problema?
Attività 2: prova a rimuovere varie funzionalità tra prodotti per migliorare il rendimento (anche se leggermente). Perché la rimozione di queste
funzionalità migliorerebbe le prestazioni?
Le risposte vengono visualizzate appena sotto l'allenamento.
Fai clic sull'icona Più per rispondere all'attività 1.
Sorprendentemente, i confini decisionali del modello sembrano un po' stravaganti. In particolare, c'è una regione in alto a sinistra che punta al blu, anche se nei dati non c'è supporto visibile.
Osserva lo spessore relativo delle cinque righe che vanno da INPUT a OUTPUT.
Queste linee mostrano i pesi relativi dei cinque elementi.
Le linee che escono da X1 e X2 sono molto più spesse di quelle provenienti dalle incroci delle caratteristiche. Quindi, le intersezioni delle caratteristiche
contribuiscono al modello molto meno rispetto alle normali caratteristiche (non incrociate).
Fai clic sull'icona Più per rispondere all'attività 2.
La rimozione di tutti gli incroci di caratteristiche determina un modello più ragionevole (non esiste più un confine curvo che potrebbe indicare l'overfitting) e fa convergere la perdita di test.
Dopo 1000 iterazioni, la perdita di test dovrebbe essere un valore leggermente inferiore rispetto a quando erano in gioco gli incroci delle caratteristiche (anche se i risultati possono variare leggermente, a seconda del set di dati).
I dati di questo esercizio sono essenzialmente dati lineari più rumore.
Se utilizziamo un modello troppo complicato, ad esempio uno con troppe incroci, gli diamo l'opportunità di adattarsi al rumore nei dati di addestramento, spesso a scapito di prestazioni scadenti del modello sui dati di test.