Sistem ML di Dunia Nyata: Prediksi Kanker

Dalam pelajaran ini, Anda akan melakukan debug pada masalah ML di dunia nyata* terkait prediksi kanker.

Contoh di Dunia Nyata: Prediksi Kanker

  • Model dilatih untuk memprediksi "probabilitas pasien menderita kanker" dari rekam medis
Sel kanker
  • Model dilatih untuk memprediksi "probabilitas pasien menderita kanker" dari rekam medis
  • Fitur termasuk usia pasien, gender, kondisi medis sebelumnya, nama rumah sakit, tanda-tanda vital, hasil tes
Sel kanker
  • Model dilatih untuk memprediksi "probabilitas pasien menderita kanker" dari rekam medis
  • Fitur termasuk usia pasien, gender, kondisi medis sebelumnya, nama rumah sakit, tanda-tanda vital, hasil tes
  • Model memberikan performa yang sangat baik pada data pengujian yang dipertahankan
Sel kanker
  • Model dilatih untuk memprediksi "probabilitas pasien menderita kanker" dari rekam medis
  • Fitur termasuk usia pasien, gender, kondisi medis sebelumnya, nama rumah sakit, tanda-tanda vital, hasil tes
  • Model memberikan performa yang sangat baik pada data pengujian yang dipertahankan
  • Namun, model berperforma buruk pada pasien baru -- mengapa?
Sel kanker

Menurut Anda, mengapa model ini tidak dapat berperforma baik pada pasien baru? Lihat apakah Anda bisa mengetahui masalahnya, lalu klik tombol Putar ▶ di bawah untuk mencari tahu apakah Anda benar.

* Kita mendasarkan modul ini dengan sangat longgar (melakukan sejumlah modifikasi selama prosesnya) pada "Kebocoran data atau data mining: formulasi, deteksi, dan penghindaran" oleh Kaufman, Rosset, dan Perlich.