Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Set Pelatihan dan Set Pengujian
Kita kembali ke Playground untuk bereksperimen dengan set pelatihan
dan set pengujian.
Klik ikon plus untuk mengingat arti titik oranye dan biru.
Dalam visualisasi:
Setiap titik biru menandakan satu contoh dari satu class data (misalnya,
spam).
Setiap titik oranye menandakan satu contoh kelas data lainnya (untuk
misalnya, bukan spam).
Warna latar belakang merepresentasikan prediksi model tempat contoh
dari warna itu harus ditemukan. Latar belakang biru di sekitar titik biru
berarti model memprediksi contoh tersebut dengan benar. Sebaliknya,
latar belakang oranye di sekitar titik biru
berarti model ini sedang membuat
prediksi yang salah
untuk contoh itu.
Latihan ini menyediakan set pengujian dan pelatihan, keduanya diambil dari
{i>dataset<i} yang sama. Secara {i>default<i}, visualisasi itu hanya menampilkan pelatihan
atur. Jika Anda juga ingin melihat set pengujian, klik
kotak centang Show test data tepat di bawah visualisasi. Di kolom
visualisasi, perhatikan perbedaan berikut:
Contoh pelatihan memiliki garis batas berwarna putih.
Contoh pengujian memiliki garis luar berwarna hitam.
Tugas 1: Jalankan Playground menggunakan setelan tertentu dengan melakukan
berikut ini:
Klik tombol Run/Pause:
Tonton perubahan nilai kerugian Pengujian dan kerugian Pelatihan.
Saat nilai Kerugian pengujian dan kerugian Pelatihan berhenti berubah
atau hanya berubah sesekali, tekan tombol Run/Pause
lagi untuk menjeda Playground.
Perhatikan delta antara Kerugian pengujian dan Kerugian pelatihan. Kita akan mencoba
mengurangi hal ini
delta di tugas berikut.
Apakah delta antara Kerugian pengujian dan Kerugian pelatihan lebih rendah atau
dengan Kecepatan pembelajaran baru ini? Yang terjadi jika Anda mengubah keduanya
Kecepatan pembelajaran dan
ukuran tumpukan?
Tugas Opsional 3: Penggeser berlabel Persentase data pelatihan
memungkinkan Anda mengontrol proporsi data pelatihan untuk menguji data. Misalnya,
ketika diatur ke 90%, maka 90% data digunakan untuk set pelatihan dan
10% sisanya digunakan
untuk set pengujian.
Lakukan hal berikut:
Mengurangi "Persentase data pelatihan" dari 50% menjadi 10%.
Bereksperimenlah dengan Kecepatan pembelajaran dan Ukuran tumpukan, dengan membuat catatan pada
temuan proyek.
Apakah perubahan persentase data pelatihan akan mengubah
pengaturan pembelajaran yang Anda
temukan di Tugas 2? Jika demikian, mengapa?
Klik ikon plus untuk jawaban Tugas 1.
Dengan kecepatan pembelajaran disetel ke 3 (pengaturan awal),
Kerugian pengujian secara signifikan lebih tinggi daripada Kerugian pelatihan.
Klik ikon plus untuk jawaban Tugas 2.
Dengan mengurangi kecepatan pembelajaran (misalnya, menjadi 0,001),
Kerugian pengujian turun ke nilai yang jauh mendekati Kerugian pelatihan. Hampir di semua proses,
meningkatkan ukuran Batch tidak memengaruhi Kerugian atau Pengujian Pelatihan
kerugian secara signifikan. Namun, dalam persentase kecil sesi, meningkatkan
Ukuran batch hingga 20 atau lebih menyebabkan Kerugian pengujian sedikit menurun
di bawah Kerugian pelatihan.
Set data Playground dibuat secara acak. Oleh karena itu,
mungkin tidak selalu
sama persis dengan jawaban Anda.
Klik ikon plus untuk jawaban Tugas 3.
Mengurangi persentase data Pelatihan dari 50% menjadi 10% secara dramatis
menurunkan jumlah titik data dalam set pelatihan. Dengan sedikit data,
ukuran batch yang tinggi dan kecepatan pemelajaran yang tinggi menyebabkan model pelatihan
dengan kacau (melompat berulang kali di atas titik minimum).
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Informasi yang saya butuhkan tidak ada","missingTheInformationINeed","thumb-down"],["Terlalu rumit/langkahnya terlalu banyak","tooComplicatedTooManySteps","thumb-down"],["Sudah usang","outOfDate","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Masalah kode / contoh","samplesCodeIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2024-08-22 UTC."],[],[]]