現実世界における ML システム: がん予測

このレッスンでは、癌予測に関連する実際の ML 問題* をデバッグします。

実際の例: がんの予測

  • 患者ががんになる確率を医療記録から予測するようにモデルをトレーニングした
がん細胞
  • 患者ががんになる確率を医療記録から予測するようにモデルをトレーニングした
  • 特徴(患者の年齢、性別、以前の病状、病院名、バイタルサイン、検査結果など)
がん細胞
  • 患者ががんになる確率を医療記録から予測するようにモデルをトレーニングした
  • 特徴(患者の年齢、性別、以前の病状、病院名、バイタルサイン、検査結果など)
  • 提示されたテストデータに対して優れたパフォーマンスを示した
がん細胞
  • 患者ががんになる確率を医療記録から予測するようにモデルをトレーニングした
  • 特徴(患者の年齢、性別、以前の病状、病院名、バイタルサイン、検査結果など)
  • 提示されたテストデータに対して優れたパフォーマンスを示した
  • しかし、新しい患者に対するモデルのパフォーマンスはきわめて低いものでした。なぜでしょうか?
がん細胞

モデルが新しい患者に対してうまく機能しなかった理由は何だと思われますか?問題を確認できた場合は、下の再生ボタン ▶ をクリックして、正しいかどうかをご確認ください。

* このモジュールは、Kaufman、Rosset, and Perlich による「データ マイニングの漏洩: