Set Pelatihan dan Pengujian

Set pengujian adalah set data yang digunakan untuk mengevaluasi model yang dikembangkan dari set pelatihan.

Set Pelatihan dan Pengujian

Bilah horizontal dibagi menjadi dua bagian: 80% di antaranya adalah set pelatihan dan 20% adalah set pengujian.
Dua model: satu model berjalan pada data pelatihan dan model lainnya berjalan pada data pengujian.  Modelnya sangat sederhana, hanya berupa garis yang membagi titik oranye dari titik biru.  Kerugian pada data pelatihan mirip dengan kerugian pada data pengujian.
  • Bagi menjadi dua set:
    • set pelatihan
    • set pengujian
  • Kesalahan yang biasa dilakukan: jangan melatih data pengujian
    • Mengalami kerugian yang sangat rendah?
    • Sebelum merayakannya, periksa apakah Anda tidak sengaja melatih data pengujian