Set Pelatihan dan Pengujian

Set pengujian adalah kumpulan data yang digunakan untuk mengevaluasi model yang dikembangkan dari set pelatihan.

Set Pelatihan dan Pengujian

Garis horizontal dibagi menjadi dua bagian: 80% di antaranya adalah set pelatihan dan 20% adalah set pengujian.
Dua model: satu model dijalankan pada data pelatihan dan model lainnya dijalankan pada data pengujian. Modelnya sangat sederhana, hanya berupa garis yang membagi titik oranye dari titik biru. Kerugian pada data pelatihan serupa dengan kerugian pada data pengujian.
  • Bagilah menjadi dua set:
    • set pelatihan
    • set pengujian
  • Kesalahan yang biasa dilakukan: jangan melatih data pengujian
    • Mengalami kerugian yang sangat rendah?
    • Sebelum menyelesaikannya, periksa apakah Anda tidak sengaja melatih data pengujian