Set Validasi: Partisi Lain

Modul sebelumnya memperkenalkan partisi set data ke dalam set pelatihan dan pengujian. Partisi ini memungkinkan Anda melatih satu set contoh, lalu menguji model terhadap serangkaian contoh yang berbeda. Dengan dua partisi, alur kerjanya dapat terlihat sebagai berikut:

Diagram alur kerja yang terdiri dari tiga tahap. 1. Latih model di set pelatihan. 2. Mengevaluasi model di set pengujian. 3. Sesuaikan model berdasarkan hasil di set pengujian. Lakukan iterasi pada 1, 2, dan 3, yang pada akhirnya memilih model yang memiliki performa terbaik pada set pengujian.

Gambar 1. Kemungkinan alur kerja?

Dalam gambar, "Menyesuaikan model" berarti menyesuaikan apa pun tentang model yang dapat Anda bayangkan—mulai dari mengubah kecepatan pembelajaran, menambahkan atau menghapus fitur, hingga mendesain model yang benar-benar baru dari awal. Di akhir alur kerja ini, Anda memilih model dengan performa terbaik pada set pengujian.

Membagi {i>dataset<i} menjadi dua {i>dataset<i} adalah ide yang baik, tetapi bukan solusi ampuh. Anda dapat mengurangi peluang overfit secara signifikan dengan mempartisi set data menjadi tiga subset yang ditampilkan dalam gambar berikut:

Bilah horizontal dibagi menjadi tiga bagian: 70% di antaranya adalah set pelatihan, 15% set validasi, dan 15% set pengujian

Gambar 2. Membagi satu set data menjadi tiga subset.

Gunakan set validasi untuk mengevaluasi hasil dari set pelatihan. Kemudian, gunakan set pengujian untuk memeriksa kembali evaluasi Anda setelah model "lulus" set validasi. Gambar berikut menunjukkan alur kerja baru ini:

Alur kerja yang serupa dengan Gambar 1, tetapi alih-alih mengevaluasi model terhadap set pengujian, alur kerja akan mengevaluasi model terhadap set validasi. Kemudian, setelah set pelatihan dan set validasi hampir sama, konfirmasi model dengan set pengujian.

Gambar 3. Alur kerja yang lebih baik.

Dalam alur kerja yang ditingkatkan ini:

  1. Pilih model dengan performa terbaik pada set validasi.
  2. Periksa kembali model tersebut terhadap set pengujian.

Ini adalah alur kerja yang lebih baik karena menghasilkan lebih sedikit eksposur ke set pengujian.