Sistem ML di Dunia Nyata: Prediksi Kanker

Dalam pelajaran ini, Anda akan melakukan debug pada masalah ML di dunia nyata* terkait dengan prediksi kanker.

Contoh di Dunia Nyata: Prediksi Kanker

  • Model dilatih untuk memprediksi "probabilitas pasien menderita kanker" dari rekam medis
Sel kanker
  • Model dilatih untuk memprediksi "probabilitas pasien menderita kanker" dari rekam medis
  • Fitur menyertakan usia, jenis kelamin, kondisi medis sebelumnya, nama rumah sakit, tanda-tanda vital, hasil tes pasien
Sel kanker
  • Model dilatih untuk memprediksi "probabilitas pasien menderita kanker" dari rekam medis
  • Fitur menyertakan usia, jenis kelamin, kondisi medis sebelumnya, nama rumah sakit, tanda-tanda vital, hasil tes pasien
  • Model memberikan performa yang sangat baik pada data uji yang dilakukan
Sel kanker
  • Model dilatih untuk memprediksi "probabilitas pasien menderita kanker" dari rekam medis
  • Fitur menyertakan usia, jenis kelamin, kondisi medis sebelumnya, nama rumah sakit, tanda-tanda vital, hasil tes pasien
  • Model memberikan performa yang sangat baik pada data uji yang dilakukan
  • Namun model menunjukkan performa yang sangat buruk pada pasien baru -- mengapa?
Sel kanker

Menurut Anda, mengapa model ini tidak dapat bekerja dengan baik pada pasien baru? Lihat apakah Anda bisa mengetahui masalahnya, lalu klik tombol Putar ▶ di bawah ini untuk mencari tahu apakah Anda benar.

* Kita menggunakan "Leakage in data mining: formulation, detection, and avoidance" oleh Kaufman, Rosset, dan Perlich sebagai landasan modul ini secara bebas, dengan membuat beberapa perubahan.