Données catégorielles: exercices de croisement de caractéristiques

Playground est une application interactive qui vous permet de manipuler différents aspects de l'entraînement et du test d'un modèle de machine learning. Avec Playground, vous pouvez sélectionner des caractéristiques et ajuster des hyperparamètres, puis découvrir comment vos choix influencent un modèle.

Cette page contient deux exercices utilisant les widgets Playground intégrés sous les instructions.

Exercice 1 : Croisement de caractéristiques de base

Pour cet exercice, concentrez-vous sur les parties suivantes de l'interface utilisateur Playground :

  • Sous "FONCTIONNALITÉS", notez les trois fonctionnalités de modèle potentielles :
    • x1
    • x2
    • x1x2
  • Sous "OUTPUT" (SORTIE), vous verrez un carré contenant des points orange et bleus. Imaginez que vous regardez une forêt carrée, où les points orange marquent la position des arbres malades et les points bleus marquent la position des arbres sains.
  • Entre les sections "FEATURES" (CARACTÉRISTIQUES) et "OUTPUT" (SORTIE), vous verrez, en y regardant de près, trois lignes pointillées discrètes reliant chaque caractéristique à la sortie. La largeur de chaque ligne en pointillés symbolise la pondération actuellement associée à chaque caractéristique. Ces lignes sont très claires, car le poids de départ de chaque caractéristique est initialisé à 0. L'épaisseur de ces lignes augmente ou diminue en fonction du poids.

Tâche 1 : Explorez Playground en procédant comme suit :

  1. Cliquez sur la ligne en pointillé qui relie la caractéristique x1 à la sortie. Un pop-up s'affiche.
  2. Dans le pop-up, saisissez la pondération 1.0.
  3. Appuyez sur Entrée.

Notez les points suivants :

  • La ligne en pointillés pour x1 s'épaissit à mesure que le poids augmente de 0 à 1.
  • Un arrière-plan orange et bleu s'affiche.
    • L'arrière-plan orange correspond aux prédictions du modèle concernant l'emplacement des arbres malades.
    • L'arrière-plan bleu correspond aux suppositions du modèle quant à l'emplacement des arbres sains. Le modèle fonctionne très mal : environ la moitié de ses prédictions sont fausses.
  • Étant donné que la pondération est de 1,0 pour x1 et de 0 pour les autres caractéristiques, le modèle correspond exactement aux valeurs de x1.

Tâche 2 : Modifiez les pondérations d'une, de deux ou des trois caractéristiques afin que le modèle (les couleurs d'arrière-plan) prédise correctement les arbres malades et sains. La solution s'affiche juste en dessous de Playground.



Exercice 2 : Croisement de caractéristiques plus sophistiqué

Pour le deuxième exercice, examinez la disposition des points orange (arbres malades) et bleus (arbres sains) dans le modèle de sortie, en remarquant les éléments suivants :

  • Les points forment des motifs à peu près sphériques.
  • La disposition des points est bruyante. Par exemple, notez les points bleus occasionnels dans la sphère extérieure de points orange. Par conséquent, même un excellent modèle est peu susceptible de prédire correctement chaque point.

Tâche 1 : Explorez l'UI du terrain de jeu en procédant comme suit :

  1. Cliquez sur le bouton Lecture/Pause, qui est un triangle blanc à l'intérieur d'un cercle noir. Playground commence à entraîner le modèle. Observez le compteur "Époques" qui augmente.
  2. Une fois que le système s'est entraîné pendant au moins 300 époques, appuyez sur le même bouton Lecture/Pause pour interrompre l'entraînement.
  3. Examinez le modèle. Le modèle fait-il de bonnes prédictions ? En d'autres termes, les points bleus sont-ils généralement entourés d'un arrière-plan bleu et les points orange d'un arrière-plan orange ?
  4. Examinez la valeur de la perte de test, qui s'affiche juste en dessous de OUTPUT. Cette valeur est-elle plus proche de 1,0 (perte plus élevée) ou de 0 (perte plus faible) ?
  5. Réinitialisez Playground en appuyant sur la flèche incurvée à gauche du bouton "Exécuter/Mettre en pause".

Tâche 2 : Créez un modèle plus performant en procédant comme suit :

  1. Sélectionnez ou désélectionnez n'importe quelle combinaison des cinq fonctionnalités possibles.
  2. Ajustez le taux d'apprentissage.
  3. Entraînez le système pendant au moins 500 époques.
  4. Examinez la valeur de la perte de test. Pouvez-vous obtenir une perte de test inférieure à 0,2 ?

Les solutions s'affichent sous Playground.