Pelajari opsi di bawah ini.
Pertimbangkan model klasifikasi yang memisahkan email menjadi dua kategori:
"spam" atau "bukan spam". Jika Anda meningkatkan batas klasifikasi, apa yang
terjadi pada presisi?
Pasti meningkat.
Meningkatkan batas klasifikasi biasanya akan meningkatkan presisi;
Namun, presisi tidak dijamin akan meningkat secara monoton
seiring dengan peningkatan ambang batas.
Mungkin meningkat.
Umumnya, meningkatkan batas klasifikasi akan mengurangi nilai
positif, sehingga meningkatkan presisi.
Mungkin menurun.
Umumnya, meningkatkan batas klasifikasi akan mengurangi nilai
positif, sehingga meningkatkan presisi.
Pasti menurun.
Umumnya, meningkatkan batas klasifikasi akan mengurangi nilai
positif, sehingga meningkatkan presisi.
Pelajari opsi di bawah ini.
Pertimbangkan model klasifikasi yang memisahkan email menjadi dua kategori:
"spam" atau "bukan spam". Jika Anda meningkatkan batas klasifikasi, apa yang
mengingat kembali?
Selalu meningkat.
Meningkatkan batas klasifikasi akan menyebabkan hal berikut:
- Jumlah positif benar akan berkurang atau tetap sama.
- Jumlah negatif palsu akan meningkat atau tetap sama.
Selalu turunkan atau tetap sama.
Meningkatkan batas klasifikasi akan menyebabkan jumlah
positif benar menurun atau tetap sama dan akan menyebabkan
jumlah negatif palsu akan bertambah atau tetap sama. Dengan demikian,
akan tetap konstan atau menurun.
Selalu konstan.
Meningkatkan batas klasifikasi akan menyebabkan jumlah
positif benar menurun atau tetap sama dan akan menyebabkan
jumlah negatif palsu akan bertambah atau tetap sama. Dengan demikian,
akan tetap konstan atau menurun.
Pelajari opsi di bawah ini.
Pertimbangkan dua model—A dan B—yang masing-masing mengevaluasi set data yang sama.
Manakah dari pernyataan berikut yang benar?
Jika Model A memiliki presisi yang lebih baik daripada model B,
model A lebih baik.
Meskipun presisi yang lebih baik itu bagus, hal itu mungkin akan mengorbankan
pengurangan yang signifikan pada perolehan. Secara umum, kita perlu melihat
baik presisi maupun perolehan, atau metrik ringkasan seperti ABK
yang akan kita bicarakan selanjutnya.
Jika model A memiliki perolehan yang lebih baik daripada model B, maka model A
dengan lebih baik.
Meskipun ingatan yang lebih baik itu bagus, itu bisa saja terjadi pada
biaya pengurangan yang
besar dalam presisi. Secara umum, kita perlu
untuk melihat baik presisi maupun perolehan, atau metrik ringkasan
seperti AUC, yang akan
kita bahas selanjutnya.
Jika model A memiliki presisi dan perolehan yang lebih baik daripada model B,
maka model A mungkin lebih baik.
Secara umum, model yang mengungguli model lain pada
presisi dan perolehan mungkin merupakan model yang lebih baik. Tentunya,
kita harus memastikan bahwa
perbandingan dilakukan pada
presisi / titik recall yang berguna dalam praktik untuk ini
menjadi bermakna. Misalnya, anggaplah model deteksi spam kita
harus memiliki setidaknya 90% presisi
agar dapat berguna dan menghindari
alarm palsu yang tidak
perlu dilakukan. Dalam hal ini, membandingkan
satu model dengan {20% presisi, 99% perolehan} ke model lain dengan
{15% presisi, 98% perolehan kembali} tidak terlalu instruktif, karena
tidak ada model yang memenuhi persyaratan presisi 90%. Namun, dengan alasan tersebut
Ini adalah cara yang baik untuk berpikir tentang membandingkan model saat menggunakan
presisi dan perolehan.