Pelajari opsi-opsi di bawah.

Kita melihat proses penggunaan set pengujian dan pelatihan untuk mendorong iterasi pengembangan model. Pada setiap iterasi, kami melatih data pelatihan dan mengevaluasi data pengujian, menggunakan hasil evaluasi pada data pengujian untuk memandu pilihan dan perubahan ke berbagai hyperparameter model seperti kecepatan pembelajaran dan fitur. Apakah ada masalah dengan pendekatan ini? (Pilih satu jawaban saja.)
Baik, kami sedang melatih data pelatihan dan mengevaluasi data pengujian terpisah yang dilakukan.
Sebenarnya, ada sedikit masalah di sini. Pikirkan apa yang mungkin terjadi jika kita melakukan banyak iterasi dari formulir ini.
Melakukan banyak perulangan prosedur ini dapat membuat kita secara implisit menyesuaikan dengan keunikan set pengujian khusus kita.
Ya, tentu saja. Semakin sering kita mengevaluasi set pengujian tertentu, semakin berisiko pula kita secara implisit melakukan overfit ke satu set pengujian tersebut. Selanjutnya, kita akan melihat protokol yang lebih baik.
Hal ini secara komputasi tidak efisien. Kita hanya perlu memilih satu set hyperparameter default dan menjalankannya bersamanya untuk menghemat resource.
Meskipun iterasi semacam ini mahal, iterasi tersebut adalah bagian penting dari pengembangan model. Setelan hyperparameter dapat membuat perbedaan besar dalam kualitas model, dan kami harus selalu mengalokasikan sejumlah waktu dan resource komputasi untuk memastikan bahwa kami mendapatkan kualitas terbaik yang kami bisa.