Esame della regolarizzazione di L2
Questo esercizio contiene un set di dati di addestramento piccolo e rumoroso. In questo tipo di contesto, l'overfitting è una preoccupazione reale. Fortunatamente, la regolarizzazione potrebbe essere d'aiuto.
Questo esercizio consiste in tre attività correlate. Per semplificare i confronti tra le tre attività, esegui ogni attività in una scheda separata.
- Attività 1: esegui il modello come indicato per almeno 500 epoche. Tieni presente quanto segue:
- Perdita di test.
- Il delta tra perdita di test e perdita di addestramento.
- I pesi appresi delle caratteristiche e della caratteristica incrociano. (Lo spessore relativo di ogni riga che va da FEATURES a OUTPUT rappresenta la ponderazione appresa per quella caratteristica o croce di caratteristiche. Puoi trovare i valori esatti della ponderazione passando il mouse sopra ogni riga.)
- Attività 2: (valuta l'opportunità di eseguire questa attività in una scheda separata) Aumenta il tasso di regolarizzazione da 0 a 0,3. Quindi, esegui il modello per almeno 500 epoche e trova le risposte alle seguenti domande:
- Qual è la differenza tra la perdita di test nell'attività 2 e la perdita di test nell'attività 1?
- Qual è la differenza tra il delta tra la perdita del test e la perdita di addestramento nell'attività 2 da quella dell'attività 1?
- In che modo i pesi appresi per ciascuna caratteristica e ciascuna funzionalità differiscono dall'attività 2 all'attività 1?
- Cosa dicono i risultati sulla complessità del modello?
- Attività 3: sperimenta con il tasso di regolarizzazione, cercando di trovare il valore ottimale.
Le risposte vengono visualizzate appena sotto l'allenamento.