Les systèmes de ML dans le monde réel: prédiction du cancer

Dans cette leçon, vous allez résoudre un problème de ML concret* lié à la prédiction du cancer.

Exemple concret: prédiction de cancer

  • Le modèle a été entraîné pour prédire le "probabilité que le patient est atteint d'un cancer" à partir de dossiers médicaux.
Cellules cancéreuses
  • Le modèle a été entraîné pour prédire le "probabilité que le patient est atteint d'un cancer" à partir de dossiers médicaux.
  • Les caractéristiques comprennent l'âge, le sexe, l'état de santé antérieur, le nom de l'hôpital, les signes vitaux et les résultats des tests.
Cellules cancéreuses
  • Le modèle a été entraîné pour prédire le "probabilité que le patient est atteint d'un cancer" à partir de dossiers médicaux.
  • Les caractéristiques comprennent l'âge, le sexe, l'état de santé antérieur, le nom de l'hôpital, les signes vitaux et les résultats des tests.
  • Le modèle a généré d'excellentes performances sur les données de test exclues
Cellules cancéreuses
  • Le modèle a été entraîné pour prédire le "probabilité que le patient est atteint d'un cancer" à partir de dossiers médicaux.
  • Les caractéristiques comprennent l'âge, le sexe, l'état de santé antérieur, le nom de l'hôpital, les signes vitaux et les résultats des tests.
  • Le modèle a généré d'excellentes performances sur les données de test exclues
  • Mais le modèle a été terriblement performant pour les nouveaux patients. Pourquoi ?
Cellules cancéreuses

Pourquoi pensez-vous que le modèle n'a pas pu être performant sur les nouveaux patients ? Essayez de trouver une solution à votre problème, puis cliquez sur le bouton de lecture ▶ ci-dessous pour savoir si vous avez raison.

* Nous avons basé ce module de manière très générale (en apportant des modifications) sur la base des "fuites dans l'exploration de données: formulation, détection et prévention" de Kaufman, Rosset et Perlich.