Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Persilangan Fitur yang Lebih Kompleks
Sekarang, mari kita bermain dengan beberapa kombinasi persilangan fitur lanjutan.
Set data di Playground ini
latihan terlihat seperti berisik
tepat sasaran dari permainan dart, dengan titik biru di tengah dan
titik-titik oranye di
cincin luar.
Klik ikon plus untuk mendapatkan penjelasan tentang visualisasi model.
Setiap latihan Playground menampilkan visualisasi data
status model. Misalnya, berikut ini visualisasi:
Perhatikan hal berikut tentang visualisasi model:
Setiap sumbu mewakili fitur tertentu. Dalam hal {i>spam<i} vs. bukan {i>spam,<i}
fiturnya bisa berupa jumlah kata dan jumlah penerima
email Anda.
Setiap titik menandai nilai fitur untuk satu contoh data, seperti
email.
Warna titik mewakili class contoh tersebut.
Misalnya, titik biru dapat mewakili email non-spam sementara
titik oranye dapat mewakili email spam.
Warna latar belakang merepresentasikan prediksi model tempat contoh
dari warna itu harus ditemukan. Latar belakang biru di sekitar titik biru
berarti model memprediksi contoh tersebut dengan benar. Sebaliknya,
latar belakang oranye di sekitar titik biru berarti bahwa model ini
salah memprediksi contoh itu.
Latar belakang biru dan oranye disesuaikan skalanya. Misalnya, sisi kiri
visualisasi berwarna biru solid tetapi secara bertahap memudar menjadi putih di tengah
dari visualisasi. Anda dapat menganggap kekuatan warna
sebagai menyarankan
kepercayaan model dalam tebakannya. Jadi warna biru solid berarti model
sangat yakin dengan tebakannya dan biru muda berarti bahwa model
kurang percaya diri. (Visualisasi model yang ditampilkan dalam gambar adalah
prediksi yang buruk).
Gunakan visualisasi untuk menilai progres model Anda.
("Sangat baik—sebagian besar titik biru memiliki latar belakang biru" atau
"Oh, tidak! Titik-titik biru memiliki latar belakang oranye.")
Selain warna, Playground
juga menampilkan kerugian model saat ini secara numerik.
("Oh tidak! Kerugian semakin naik, bukan turun.")
Tugas 1: Jalankan model linear ini seperti yang diberikan. Luangkan satu atau dua menit (tapi tidak
lebih lama) mencoba setelan kecepatan pemelajaran yang berbeda
untuk melihat apakah Anda dapat menemukan
perbaikan apa pun. Dapatkah model linear
memberikan hasil yang efektif untuk
{i>dataset<i} ini?
Tugas 2: Sekarang coba tambahkan fitur lintas produk, seperti
x1x2, mencoba mengoptimalkan performa.
Fitur mana yang paling membantu?
Berapa performa terbaik yang bisa Anda dapatkan?
Tugas 3: Jika Anda memiliki model yang bagus, periksa output model
platform (ditunjukkan dengan warna latar belakang).
Apakah itu terlihat seperti model linear?
Bagaimana Anda akan menggambarkan model ini?
(Jawaban muncul tepat di bawah latihan.)
Klik ikon plus untuk jawaban Tugas 1.
Tidak. Model linear tidak dapat membuat model set data ini secara efektif. Lebih rendah
kecepatan pembelajaran mengurangi kerugian, tetapi kerugian tetap menyatu pada
sangat bernilai tinggi.
Klik ikon plus untuk jawaban Tugas 2.
Set data Playground dibuat secara acak. Oleh karena itu,
mungkin tidak selalu
sama persis dengan jawaban Anda. Bahkan, jika Anda
membuat ulang set data di antara proses, hasil Anda sendiri tidak selalu
setuju dengan operasi Anda sebelumnya. Meskipun demikian, Anda akan
menjadi lebih baik
dengan melakukan hal berikut:
Menggunakan x12 dan x22 sebagai
persilangan fitur. (Menambahkan x1x2 sebagai persilangan fitur
tampaknya tidak membantu).
Mengurangi Kecepatan pembelajaran, mungkin menjadi 0,001.
Klik ikon plus untuk jawaban Tugas 3.
Permukaan output model tidak terlihat seperti model linear. Sebaliknya,
terlihat elips.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Informasi yang saya butuhkan tidak ada","missingTheInformationINeed","thumb-down"],["Terlalu rumit/langkahnya terlalu banyak","tooComplicatedTooManySteps","thumb-down"],["Sudah usang","outOfDate","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Masalah kode / contoh","samplesCodeIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2024-08-22 UTC."],[],[]]