Interpretazione delle curve di perdita

Il machine learning sarebbe un gioco da ragazzi se tutte le nostre curve di perdita siano risultate come queste la prima volta che abbiamo addestrato il nostro modello:

Un grafico che mostra la curva di perdita ideale durante l'addestramento di un modello di machine learning.
La curva delle perdite traccia la perdita sull'asse y rispetto al numero di passaggi di addestramento sull'asse x. Man mano che il numero di passi di addestramento aumenta, la perdita inizia alta, quindi diminuisce in modo esponenziale e, infine, si riduce, per raggiungere una perdita minima.

In realtà, però, le curve di perdita possono essere piuttosto difficili da interpretare. Utilizza la tua comprensione delle curve di perdita per rispondere alle seguenti domande.

1. Il mio modello non viene addestrato!

Il tuo amico Mel e tu continui a lavorare a un predittore per l'aspetto di unicorno. Ecco la tua prima curva di perdita.

Un grafico della curva di perdita con gli stessi assi del grafico precedente. In questo caso, la perdita non si è appiattita, ma aumenta e diminuisce in modo irregolare, in modo che il tracciato oscilla.

Descrivi il problema e indica in che modo Mel può risolverlo:

2. È esplosa la mia perdita!

Mel mostra un'altra curva. Cosa non va qui e come può risolverlo? Scrivi la tua risposta qui sotto.

Un grafico della curva di perdita che mostra come la perdita diminuisce fino a un determinato numero di passaggi di addestramento, per poi aumentare improvvisamente con ulteriori passaggi di addestramento.

3. Le metriche sono contraddittorie.

Mela vuole avere un'altra curva. Qual è il problema e come può risolverlo? Scrivi la tua risposta qui sotto.

L'immagine mostra due grafici. Il grafico a sinistra mostra la curva di perdita ideale.
Il grafico a destra mostra la metrica di richiamo che rimane a 0 anche se il numero di passi di addestramento aumenta.

Descrivi il problema e indica in che modo Mel può risolverlo:

4. La perdita di controllo è troppo alta!

Mel ti mostra le curve di perdita per i set di dati di addestramento e test e ti chiede "Cosa c'è che non va?" Scrivi la tua risposta di seguito.

Viene tracciato un grafico della curva di perdita che mostra la divergenza tra l'addestramento e la perdita di test durante l'addestramento del modello.

Descrivi il problema e indica in che modo Mel può risolverlo:

5. Il mio modello si blocca

Sei paziente quando Mel torna qualche giorno dopo con un'altra curva. Cosa va storto qui e come può correggerlo?

Un grafico di una curva di perdita che mostra la perdita che inizia a convergere con l'addestramento, ma poi mostra schemi ripetuti che sembrano un'onda rettangolare.

Descrivi il problema e indica in che modo Mel può risolverlo:

Funziona!

"Funziona perfettamente!" Mel esclama. Si sporge sulla sedia trionfante e solleva un grande sospiro. La curva ha un bell'aspetto e trasmette con il contorno. Mel e dedica un momento a discutere i seguenti controlli aggiuntivi per la convalida del modello.

  • metriche reali
  • basi
  • Perdita assoluta per problemi di regressione
  • altre metriche per problemi di classificazione
  • Un grafico che mostra una curva di perdita che converge.