Model machine learning (ML) tidak memiliki tujuan inheren. Praktisi ML melatih model dengan memberinya set data yang berisi contoh pelatihan, dan Keterlibatan dalam penyediaan dan kurasi data ini dapat membuat dan prediksi yang rentan terhadap bias.
Saat membangun model, penting untuk menyadari bias-bias manusia yang umum terjadi yang dapat muncul dalam data Anda, sehingga Anda dapat mengambil langkah proaktif untuk yang dihasilkan.
Bias pelaporan
-
Definisi
Bias pelaporan terjadi ketika frekuensi peristiwa, properti, dan/atau hasil yang diambil dalam {i>dataset<i} tidak secara akurat mencerminkan frekuensi mereka di dunia nyata. Bias ini bisa timbul karena orang cenderung fokus pada mendokumentasikan keadaan yang tidak biasa atau sangat mudah diingat, dengan asumsi bahwa hal yang biasa tidak yang perlu direkam.
-
Contoh
Model analisis sentimen dilatih untuk memprediksi apakah ulasan positif atau negatif berdasarkan korpus pengguna pengiriman ke situs web populer. Sebagian besar ulasan di yang berbeda mencerminkan pendapat yang ekstrem (pengulas yang menyukai atau benci buku), karena orang cenderung tidak mengirimkan ulasan buku jika mereka tidak menanggapinya dengan kuat. Sebagai seorang model tersebut kurang mampu memprediksi sentimen dengan benar ulasan yang menggunakan bahasa yang lebih halus untuk mendeskripsikan sebuah buku.
Klik chevron_left untuk definisinya.
Bias historis
-
Definisi
Bias historis terjadi saat data historis menunjukkan ketidaksetaraan yang ada di dunia pada saat itu.
-
Contoh
{i>Dataset<i} perumahan kota dari tahun 1960-an berisi data harga rumah yang mencerminkan praktik pinjaman diskriminatif yang berlaku selama periode tersebut satu dekade.
Klik chevron_left untuk definisinya.
Bias otomatisasi
-
Definisi
Bias otomatisasi adalah kecenderungan untuk mengutamakan hasil dibuat oleh sistem otomatis daripada yang dibuat oleh sistem sistem, terlepas dari tingkat kesalahan masing-masing.
-
Contoh
Praktisi ML yang bekerja untuk produsen sproket ingin men-deploy "terobosan" baru yang dilatih untuk mengidentifikasi cacat gigi, sampai pengawas pabrik menunjukkan bahwa presisi dan tingkat perolehan model keduanya 15% lebih rendah daripada pemeriksa manusia.
Klik chevron_left untuk definisinya.
Bias seleksi
Bias seleksi terjadi jika contoh set data dipilih dengan cara yang tidak mencerminkan distribusi di dunia nyata. Bias seleksi memiliki berbagai bentuk, termasuk bias cakupan, bias non-respons, dan bias pengambilan sampel.
Bias cakupan
-
Definisi
Bias cakupan terjadi jika data tidak dipilih dalam mode yang representatif.
-
Contoh
Sebuah model dilatih untuk memprediksi penjualan produk baru di masa mendatang berdasarkan tentang survei telepon yang dilakukan dengan sampel konsumen yang membeli produk. Konsumen yang memilih untuk membeli produk pesaing tidak disurvei, dan sebagai hasilnya, kelompok orang ini tidak yang direpresentasikan dalam data pelatihan.
Klik chevron_left untuk definisinya.
Bias Non-Respons
-
Definisi
Bias non-respons (juga dikenal sebagai bias partisipasi) terjadi jika data pada akhirnya tidak representatif karena kesenjangan partisipasi dalam pengumpulan data {i>checkout<i}.
-
Contoh
Sebuah model dilatih untuk memprediksi penjualan produk baru di masa mendatang berdasarkan tentang survei telepon yang dilakukan dengan sampel konsumen yang membeli produk dan dengan sampel konsumen yang membeli produk pesaing Google. Konsumen yang membeli produk pesaing 80% lebih banyak cenderung menolak untuk menyelesaikan survei, dan data mereka kurang terwakili dalam sampel.
Klik chevron_left untuk definisinya.
Bias sampling
-
Definisi
Bias pengambilan sampel terjadi jika pengacakan yang tepat tidak digunakan selama pengumpulan data.
-
Contoh
Sebuah model dilatih untuk memprediksi penjualan produk baru di masa mendatang berdasarkan tentang survei telepon yang dilakukan dengan sampel konsumen yang membeli produk dan dengan sampel konsumen yang membeli produk pesaing Google. Alih-alih menarget konsumen secara acak, surveyor memilih 200 konsumen pertama yang menanggapi email, yang mungkin lebih antusias terhadap produk daripada rata-rata pembeli.
Klik chevron_left untuk definisinya.
Bias atribusi golongan
Bias atribusi golongan adalah kecenderungan untuk menggeneralisasi bahwa apa yang benar tentang individu itu berlaku untuk seluruh kelompok mereka memilikinya. Bias atribusi golongan sering kali muncul dalam dua hal formulir.
Bias dalam golongan
-
Definisi
Bias dalam golongan adalah preferensi bagi anggota kelompok Anda sendiri yang juga Anda ikuti, atau untuk karakteristik yang juga Anda bagikan.
-
Contoh
Dua praktisi ML melatih model penyaringan resume untuk pengembang perangkat lunak cenderung meyakini bahwa pelamar yang belajar di akademi ilmu komputer yang sama dengan mereka lebih memenuhi syarat untuk peran tersebut.
Klik chevron_left untuk definisinya.
Bias kehomogenan luar golongan
-
Definisi
Bias kehomogenan luar golongan adalah kecenderungan untuk stereotip anggota individu suatu kelompok yang tidak Anda , atau untuk melihat karakteristiknya secara lebih seragam.
-
Contoh
Dua praktisi ML melatih model penyaringan resume untuk pengembang perangkat lunak cenderung meyakini bahwa semua pelamar yang sebelumnya tidak belajar di akademi ilmu komputer tidak memiliki keahlian yang memadai untuk posisi tersebut.
Klik chevron_left untuk definisinya.
Bias Implisit
-
Definisi
Bias implisit terjadi saat asumsi dibuat berdasarkan model pemikiran dan pengalaman pribadi seseorang yang belum tentu berlaku secara lebih umum.
-
Contoh
Seorang praktisi ML yang melatih model pengenalan gestur menggunakan menggelengkan kepala fitur untuk menunjukkan bahwa seseorang mengkomunikasikan kata "tidak." Namun, di beberapa wilayah di dunia, menggelengkan kepala berarti “ya”.
Klik chevron_left untuk definisinya.
Bias konfirmasi
-
Definisi
Bias konfirmasi terjadi saat builder model memproses data secara tidak sadar dengan cara menegaskan keyakinan yang sudah ada sebelumnya dan hipotesis.
-
Contoh
Seorang praktisi ML sedang membangun model yang memprediksi agresivitas pada berdasarkan berbagai fitur (tinggi, berat, jenis, tertentu). Praktisi ini memiliki pengalaman yang tidak menyenangkan dengan seorang pudel mainan hiperaktif ketika kecil, dan sejak itu telah mengaitkan berkembang biak dengan agresif. Saat mengkurasi data pelatihan model, praktisi secara tidak sadar membuang fitur-fitur yang memberikan bukti kepatuhan pada yang lebih kecil.
Klik chevron_left untuk definisinya.
Bias pelaku eksperimen
-
Definisi
Bias pelaku eksperimen terjadi saat pembuat model terus melatih model hingga menghasilkan hasil yang selaras dengan hipotesis awal mereka.
-
Contoh
Seorang praktisi ML sedang membangun model yang memprediksi agresivitas pada berdasarkan berbagai fitur (tinggi, berat, jenis, tertentu). Praktisi ini memiliki pengalaman yang tidak menyenangkan dengan seorang pudel mainan hiperaktif ketika kecil, dan sejak itu telah mengaitkan berkembang biak dengan agresif. Ketika model yang dilatih memprediksi pudel mainan menjadi relatif jinak, praktisi melatih ulang model beberapa kali lagi hingga menghasilkan hasil yang menunjukkan pudel yang lebih kecil menjadi lebih kejam.
Klik chevron_left untuk definisinya.