Pelajari opsi-opsi di bawah.
Kita melihat proses penggunaan set pengujian dan pelatihan untuk mendorong iterasi pengembangan model. Pada setiap iterasi, kami melatih data pelatihan dan mengevaluasi data pengujian, menggunakan hasil evaluasi pada data pengujian untuk memandu pilihan dan perubahan ke berbagai hyperparameter model seperti kecepatan pembelajaran dan fitur. Apakah ada masalah
dengan pendekatan ini? (Pilih satu jawaban saja.)
Baik, kami sedang melatih data pelatihan dan mengevaluasi data pengujian terpisah yang dilakukan.
Sebenarnya, ada sedikit masalah di sini. Pikirkan apa yang mungkin terjadi jika kita melakukan banyak iterasi dari formulir ini.
Melakukan banyak perulangan prosedur ini dapat membuat kita secara implisit menyesuaikan dengan keunikan set pengujian khusus kita.
Ya, tentu saja. Semakin sering kita mengevaluasi set pengujian tertentu, semakin
berisiko pula kita secara implisit melakukan overfit ke satu set pengujian tersebut.
Selanjutnya, kita akan melihat protokol yang lebih baik.
Hal ini secara komputasi tidak efisien. Kita hanya perlu memilih satu set hyperparameter default dan menjalankannya bersamanya untuk menghemat resource.
Meskipun iterasi semacam ini mahal, iterasi tersebut adalah bagian penting dari
pengembangan model. Setelan hyperparameter dapat membuat perbedaan besar dalam
kualitas model, dan kami harus selalu mengalokasikan sejumlah waktu dan resource komputasi
untuk memastikan bahwa kami mendapatkan kualitas terbaik yang kami bisa.