Klasifikasi: Benar vs. Palsu dan Positif vs. Negatif

Di bagian ini, kita akan mendefinisikan blok pembangun utama metrik yang akan kita gunakan untuk mengevaluasi model klasifikasi. Namun pertama-tama, baca cerita fabel berikut:

Fabel Aesop: Anak Laki-Laki yang Berteriak "Serigala!" (dipersingkat)

Seorang bocah laki-laki penggembala merasa bosan menggembala ternak milik penduduk desa. Untuk bersenang-senang, dia berteriak, "Serigala!" meskipun dia tidak melihat serigala. Penduduk desa berlari untuk menyelamatkan ternaknya, tetapi kemudian merasa kesal saat mengetahui bahwa ternyata anak tersebut mempermainkan mereka.

[Iterasi paragraf sebelumnya N kali.]

Suatu malam, bocah penggembala tersebut benar-benar melihat seekor serigala mendekati hewan ternak dan dia berteriak, "Serigala!" Para penduduk desa tidak ingin dibodohi lagi dan memilih untuk tetap di rumah mereka. Serigala yang lapar melahap domba-domba tersebut. Kemudian desa tersebut dilanda kelaparan, dan terjadilah kepanikan.

Mari kita buat definisi berikut:

  • "Serigala" adalah kelas positif.
  • "Tidak ada serigala" adalah kelas negatif.

Kita dapat meringkas model "prediksi serigala" menggunakan matriks konfusi 2x2 yang menggambarkan keempat hasil yang mungkin:

Positif Benar (PB):
  • Realitas: terdapat ancaman serigala.
  • Penggembala berteriak: "Serigala".
  • Hasil: Penggembala adalah seorang pahlawan.
Positif Palsu (PP):
  • Realitas: Tidak ada ancaman serigala.
  • Penggembala berteriak: "Serigala".
  • Hasil: Penduduk desa marah pada penggembala karena telah membangunkannya.
Negatif Palsu (NP):
  • Realitas: terdapat ancaman serigala.
  • Penggembala berteriak: "Tidak ada serigala".
  • Hasil: Serigala memakan semua domba.
Negatif Benar (NB):
  • Realitas: Tidak ada ancaman serigala.
  • Penggembala berteriak: "Tidak ada serigala".
  • Hasil: Semua baik-baik saja.

Positif benar adalah hasil jika model benar memprediksi kelas positif. Begitu juga, negatif benar adalah hasil jika model benar memprediksi kelas negatif.

Positif palsu adalah hasil jika model salah memprediksi kelas positif. Dan negatif palsu adalah hasil jika model salah memprediksi kelas negatif.

Pada bagian berikut, kita akan mempelajari cara mengevaluasi model klasifikasi models menggunakan metrik dari keempat hasil ini.