Interpréter les courbes de fonction de perte

Le machine learning serait très facile si toutes nos courbes de perte se présentaient comme suit la première fois que nous avons entraîné notre modèle:

Graphique représentant la courbe de perte idéale lors de l'entraînement d'un modèle de machine learning.
La courbe de fonction de perte représente la perte sur l'axe Y par rapport au nombre de pas d'entraînement sur l'axe X. À mesure que le nombre d'étapes d'entraînement augmente, la perte commence à être élevée, puis diminue de manière exponentielle et finit par s'aplatir pour atteindre une perte minimale.

En réalité, les courbes de fonction de perte peuvent être assez difficiles à interpréter. Utilisez vos connaissances sur les courbes de fonction de perte pour répondre aux questions suivantes.

1. Mon modèle ne sera pas entraîné !

Votre ami Mel et vous continuez à travailler sur un prédicteur d'apparence de licorne. Voici votre première courbe de fonction de perte.

Un graphique de courbe de fonction de perte avec les mêmes axes que le graphique précédent. Ici, la perte ne s'aplatit pas, mais augmente et diminue de manière irrégulière, de sorte que le graphique oscille.

Décrivez le problème et la façon dont Mel pourrait le résoudre :

2. Ma perte a explosé !

Mel vous montre une autre courbe. Quel est le problème et comment peut-elle y remédier ? Rédigez votre réponse ci-dessous.

Un graphique de courbe de fonction de perte qui montre comment la perte diminue jusqu'à un certain nombre de pas, puis augmente soudainement avec d'autres pas.

3. Mes métriques sont contradictoires !

Melissa veut prendre une autre courbe. Que se passe-t-il et comment peut-elle y remédier ? Rédigez votre réponse ci-dessous.

L'image montre deux graphiques. Le graphique de gauche indique la courbe de fonction de perte idéale.
Le graphique de droite montre que la métrique de rappel reste à 0, même lorsque le nombre de pas d'entraînement augmente.

Décrivez le problème et la façon dont Mel pourrait le résoudre :

4. La perte d'évaluation est trop forte !

Mel vous montre les courbes de fonction de perte pour les ensembles de données d'entraînement et de test et demande "Quel est le problème ?" Écrivez votre réponse ci-dessous.

Un graphique de courbe de perte montrant les différences entre l'entraînement et la perte d'évaluation lors de l'entraînement d'un modèle

Décrivez le problème et la façon dont Mel pourrait le résoudre :

5. Mon modèle est bloqué

Vous êtes patient lorsque Mel est de retour quelques jours plus tard avec une autre courbe. Quel est le problème et comment Mel peut-il y remédier ?

Graphique de courbe de fonction de perte montrant la perte qui commence à converger avec l'entraînement, puis qui affiche des motifs répétés qui ressemblent à une vague rectangulaire.

Décrivez le problème et la façon dont Mel pourrait le résoudre :

Cela fonctionne !

"Ça fonctionne parfaitement maintenant !" s'exclame Mel. Elle s'appuie sur sa chaise de façon mélancolique et soupire un grand soupir. La courbe est magnifique et vous obtenez un résultat positif. Vous prenez le temps de discuter des vérifications supplémentaires suivantes pour valider votre modèle.

  • métriques réelles
  • références
  • perte absolue pour les problèmes de régression
  • Autres métriques pour les problèmes de classification
  • Graphique représentant une courbe de fonction de perte convergente.