Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Il machine learning sarebbe un gioco da ragazzi se tutte le nostre curve di perdita
siano risultate come queste la prima volta che abbiamo addestrato il nostro modello:
In realtà, però, le curve di perdita possono essere piuttosto difficili da interpretare. Utilizza la tua comprensione delle curve di perdita per rispondere alle seguenti domande.
1. Il mio modello non viene addestrato!
Il tuo amico Mel e tu continui a lavorare a un predittore per l'aspetto di unicorno.
Ecco la tua prima curva di perdita.
Descrivi il problema e indica in che modo Mel può risolverlo:
Fai clic sull'icona con il segno più per espandere la sezione e visualizzare la risposta.
Il modello non converge. Prova questi passaggi di debug:
Per verificare se le tue funzionalità possono prevedere le etichette, segui i passaggi descritti in
Debug del modello.
Confronta i tuoi dati con uno schema di dati per rilevare esempi errati.
Se l'addestramento sembra instabile, come in questo grafico, riduci la velocità di apprendimento per evitare che il modello scorra all'interno dello spazio dei parametri.
Semplifica il tuo set di dati con 10 esempi di cui il tuo modello può fare previsioni. Ottieni una perdita molto bassa
sul set di dati ridotto. Poi continua il debug del modello sul set di dati completo.
Semplifica il tuo modello e assicurati che abbia un rendimento superiore alla base di riferimento. Quindi, aggiungi in modo incrementale la complessità al modello.
2. È esplosa la mia perdita!
Mel mostra un'altra curva. Cosa non va qui e come può risolverlo?
Scrivi la tua risposta qui sotto.
Fai clic sull'icona con il segno più per espandere la sezione e visualizzare
la risposta.
Un forte aumento della perdita è in genere causato da valori anomali nei dati di input. Le possibili cause sono:
NaN nei dati di input.
Esplosione di sfumatura a causa di dati anomali.
Divisione per zero.
Logaritmo di zero o numeri negativi.
Per correggere una perdita esplosiva, verifica la presenza di dati anomali nei batch
e nei dati strutturati. Se l'anomalia sembra problematica, esamina la causa. Altrimenti, se l'anomalia assomiglia a dati esterni, assicurati che i valori anomali siano distribuiti in modo uniforme tra i gruppi eseguendo l'ordinazione dei dati.
3. Le metriche sono contraddittorie.
Mela vuole avere un'altra curva. Qual è il problema e come può risolverlo? Scrivi la tua risposta qui sotto.
Descrivi il problema e indica in che modo Mel può risolverlo:
Fai clic sull'icona con il segno più per espandere la sezione e visualizzare la risposta.
Il richiamo è bloccato a 0 perché la probabilità di classificazione dei tuoi esempi non è mai superiore alla soglia per la classificazione positiva. Questa situazione si verifica spesso in caso di problemi con un elevato squilibrio di classe. Ricorda che le librerie ML, come TF Keras, in genere utilizzano una soglia predefinita di 0,5 per calcolare le metriche di classificazione.
Prova questi passaggi:
Abbassa la soglia di classificazione.
Controllare le metriche basate sulla variazione della soglia, ad esempio AUC.
4. La perdita di controllo è troppo alta!
Mel ti mostra le curve di perdita per i set di dati di addestramento e test e ti chiede
"Cosa c'è che non va?" Scrivi la tua risposta di seguito.
Descrivi il problema e indica in che modo Mel può risolverlo:
Fai clic sull'icona con il segno più per espandere la sezione e visualizzare
la risposta.
Il modello è in eccesso rispetto ai dati di addestramento. Prova questi passaggi:
Riduci la capacità del modello.
Aggiungi regolarizzazione.
Verifica che le suddivisioni di addestramento e test siano statisticamente equivalenti.
5. Il mio modello si blocca
Sei paziente quando Mel torna qualche giorno dopo con un'altra curva. Cosa va storto qui e come può correggerlo?
Descrivi il problema e indica in che modo Mel può risolverlo:
Fai clic sull'icona con il segno più per espandere la sezione e visualizzare
la risposta.
La perdita mostra un comportamento ripetitivo, simile a un passo. È probabile
che i dati di input visualizzati dal tuo modello mostrino
un comportamento ripetitivo. Assicurati che l'ordinamento causa la rimozione del comportamento ripetitivo dai dati di input.
Funziona!
"Funziona perfettamente!" Mel esclama. Si sporge sulla sedia
trionfante e solleva un grande sospiro. La curva ha un bell'aspetto e trasmette con il contorno. Mel e dedica un momento a discutere i seguenti controlli aggiuntivi per la convalida del modello.