Ensembles d'apprentissage et d'évaluation : exercice dans Playground

Ensembles d'apprentissage et d'évaluation

Nous retrouvons Playground pour mieux comprendre le fonctionnement des ensembles d'apprentissage et d'évaluation.

Cet exercice présente un ensemble d'évaluation et un ensemble d'apprentissage provenant du même ensemble de données. Par défaut, la représentation graphique n'affiche que l'ensemble d'apprentissage. Pour afficher l'ensemble d'évaluation, cliquez sur la case Show test data (Afficher les données d'évaluation) située sous la représentation graphique. Chaque type d'élément s'affiche différemment sur la représentation graphique :

  • Les exemples d'apprentissage ont des contours blancs.
  • Les exemples d'évaluation ont des contours noirs.

Tâche 1 : exécutez Playground avec les paramètres fournis en procédant comme suit :

  1. Cliquez sur le bouton Lecture/Pause .
  2. Observez l'évolution des valeurs de la perte d'évaluation et de la perte d'apprentissage.
  3. Lorsque les valeurs de la perte d'évaluation et de la perte d'apprentissage se stabilisent ou ne changent que de façon intermittente, appuyez de nouveau sur le bouton Lecture/Pause pour mettre en pause Playground.
Constatez-vous un delta important entre la perte d'évaluation et la perte d'apprentissage ?

Tâche 2 : procédez comme suit :

  1. Cliquez sur le bouton Réinitialiser .
  2. Modifiez le taux d'apprentissage.
  3. Cliquez sur le bouton Lecture/Pause .
  4. Laissez Playground effectuer au moins 150 itérations.

Le delta entre la perte d'évaluation et la perte d'apprentissage est-il plus bas ou plus élevé avec ce nouveau taux d'apprentissage ? Que se passe-t-il si vous modifiez à la fois le taux d'apprentissage et la taille du lot ?

Tâche 3 (facultative) : un curseur portant le libellé Ratio of training to test data (Ratio des données d'apprentissage et d'évaluation) vous permet de contrôler la proportion de données d'évaluation par rapport aux données d'apprentissage. Par exemple, une valeur de 90 % signifie que l'ensemble d'apprentissage contient un nombre d'exemples très largement supérieur à l'ensemble d'évaluation. Lorsque cette valeur est définie à 10 %, l'ensemble d'apprentissage contient bien moins d'exemples que l'ensemble d’évaluation.

Procédez comme suit :

  1. Réduisez la valeur du "Ratio of training data to test data" (Ratio des données d'apprentissage et d'évaluation) de 50 % à 10 %.
  2. Essayez différentes valeurs de taux d'apprentissage et de taille du lot et prenez note des résultats observés.
La modification du rapport entre les données d'apprentissage et les données d'évaluation affecte-t-elle les paramètres d'apprentissage optimaux obtenus lors de la tâche 2 ? Si oui, pour quelle raison ?

 



Envoyer des commentaires concernant…

Cours d'initiation au machine learning