Ensembles d'apprentissage et d'évaluation

Un ensemble d'évaluation est un ensemble de données utilisé pour évaluer le modèle développé à partir d'un ensemble d'apprentissage.

Ensembles d'apprentissage et d'évaluation

Partitionnement d'ensembles de données

Une barre horizontale divisée en deux parties : 80 % pour l'ensemble d'apprentissage et 20 % pour l'ensemble d'évaluation

Évaluation de l'apprentissage et évaluation du test

Deux modèles : l'un s'exécute sur les données d'apprentissage et l'autre sur les données d'évaluation Le modèle est très simple, avec juste une ligne séparant les points orange des points bleus. Le coût pour les données d'apprentissage est semblable à celui pour les données d'évaluation.

Que faire si je ne possède qu'un seul ensemble de données ?

  • Divisez-le en deux ensembles :
    • ensemble d'apprentissage
    • ensemble d'évaluation
  • Piège classique : n'effectuez pas l'apprentissage sur vos données d'évaluation.
    • Vous obtenez une perte étonnamment faible ?
    • Ne vous réjouissez pas trop vite. Vérifiez que vous n'avez pas effectué par erreur l'apprentissage sur vos données d'évaluation.

Envoyer des commentaires concernant…

Cours d'initiation au machine learning