Bu sayfada Sorumlu Yapay Zeka terimleri sözlüğü yer almaktadır. Tüm sözlük terimleri için burayı tıklayın.
A
özellik
Özellik kelimesinin eş anlamlısı.
Makine öğreniminde adalet bağlamında özellikler genellikle bireylerle ilgili karakteristikleri ifade eder.
otomasyon önyargısı
İnsan karar verici, otomatik karar verme sistemi tarafından verilen önerileri, otomatik karar verme sistemi hata yapsa bile otomasyon olmadan verilen bilgilere tercih ettiğinde ortaya çıkar.
Daha fazla bilgi için Adalet: Makine Öğrenimi Hızlandırılmış Kursu'nda önyargı türleri başlıklı makaleyi inceleyin.
B
önyargı (etik/adalet)
1. Bazı şeylere, insanlara veya gruplara karşı diğerlerine kıyasla stereotip oluşturma, önyargı veya kayırma Bu önyargılar, verilerin toplanmasını ve yorumlanmasını, sistem tasarımını ve kullanıcıların sistemle etkileşim kurma şeklini etkileyebilir. Bu tür yanlılığın biçimleri şunlardır:
- otomasyon önyargısı
- doğrulama yanlılığı
- deneyci yanlılığı
- gruba atfetme önyargısı
- örtülü önyargı
- Grup içi önyargı
- grup dışı homojenlik önyargısı
2. Örnekleme veya raporlama prosedürüyle ortaya çıkan sistematik hata. Bu tür yanlılığın biçimleri şunlardır:
- kapsam yanlılığı (coverage bias)
- yanıt vermeme eğilimi (non-response bias)
- katılım önyargısı (participation bias)
- raporlama yanlılığı
- örnekleme yanlılığı
- seçim önyargısı
Makine öğrenimi modellerindeki bias terimi veya tahmin yanlılığı ile karıştırılmamalıdır.
Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Adalet: Önyargı türleri bölümüne bakın.
C
doğrulama önyargısı
Bilgiyi önceden var olan inançları veya hipotezleri doğrulayacak şekilde arama, yorumlama, tercih etme ve hatırlama eğilimi. Makine öğrenimi geliştiricileri, verileri mevcut inançlarını destekleyen bir sonucu etkileyecek şekilde yanlışlıkla toplayabilir veya etiketleyebilir. Doğrulama önyargısı, bir örtülü önyargı biçimidir.
Deney yapanın yanlılığı, önceden var olan bir hipotez doğrulanana kadar deney yapan kişinin modelleri eğitmeye devam ettiği bir doğrulama yanlılığı biçimidir.
karşıolgusal adalet
Bir adalet metriği, bir sınıflandırma modelinin, bir veya daha fazla hassas özellik dışında ilk kişiyle aynı olan başka bir kişi için aynı sonucu üretip üretmediğini kontrol eder. Karşı olgusal adalet için bir sınıflandırma modelini değerlendirmek, modeldeki olası önyargı kaynaklarını ortaya çıkarmanın bir yöntemidir.
Daha fazla bilgi için aşağıdaki kaynaklardan birine bakın:
- Makine Öğrenimi Hızlandırılmış Kursu'nda Adalet: Karşıolgusal adalet.
- When Worlds Collide: Integrating Different Counterfactual Assumptions in Fairness
kapsam yanlılığı
Seçim yanlılığı konusunu inceleyin.
D
demografik eşitlik
Bir modelin sınıflandırma sonuçları belirli bir hassas özelliğe bağlı değilse karşılanan bir adalet metriği.
Örneğin, hem Lilliputlular hem de Brobdingnaglılar Glubbdubdrib Üniversitesi'ne başvuruyorsa bir grubun ortalama olarak diğerinden daha nitelikli olup olmadığına bakılmaksızın, kabul edilen Lilliputluların yüzdesi ile kabul edilen Brobdingnaglıların yüzdesi aynı olduğunda demografik eşitlik sağlanır.
Eşitlenmiş olasılıklar ve fırsat eşitliği ile karşılaştırıldığında, toplu sınıflandırma sonuçlarının hassas özelliklere bağlı olmasına izin verilir ancak belirli gerçek etiketleri için sınıflandırma sonuçlarının hassas özelliklere bağlı olmasına izin verilmez. Demografik eşitlik için optimizasyon yaparken yapılan fedakarlıkları inceleyen bir görselleştirme için "Daha akıllı makine öğrenimiyle ayrımcılığa karşı mücadele etme" başlıklı makaleye bakın.
Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Adalet: demografik eşitlik bölümüne bakın.
ayrımcı etki
Farklı nüfus alt gruplarını orantısız bir şekilde etkileyen kararlar verme Bu durum genellikle algoritmik karar verme sürecinin bazı alt gruplara diğerlerinden daha fazla zarar verdiği veya fayda sağladığı durumları ifade eder.
Örneğin, bir Lilliputlu'nun minyatür ev kredisine uygunluğunu belirleyen bir algoritmanın, posta adresinde belirli bir posta kodu varsa bu kişiyi "uygun değil" olarak sınıflandırma olasılığı daha yüksektir. Big-Endian Lilliputians'ın, Little-Endian Lilliputians'a kıyasla bu posta koduna sahip posta adreslerinin olma olasılığı daha yüksekse bu algoritma, farklı bir etkiyle sonuçlanabilir.
Alt grup özelliklerinin algoritmik bir karar verme sürecine açıkça dahil edilmesiyle ortaya çıkan farklılıkları ele alan farklı muamele ile karşılaştırılır.
farklı muamele
Deneklerin hassas özelliklerini, farklı insan alt gruplarının farklı şekilde ele alınacağı şekilde algoritmik bir karar alma sürecine dahil etmek.
Örneğin, Lilliputluların kredi başvurularında sağladıkları verilere göre minyatür ev kredisine uygunluğunu belirleyen bir algoritmayı ele alalım. Algoritma, bir Lilliputian'ın bağlılığını Big-Endian veya Little-Endian olarak girdi olarak kullanıyorsa bu boyut boyunca farklı muamele uygulanıyor demektir.
Farklı etki ile karşılaştırıldığında, bu kavram, alt grupların modele giriş olup olmadığına bakılmaksızın, algoritmik kararların toplumsal etkilerindeki farklılıklara odaklanır.
E
fırsat eşitliği
Bir modelin, hassas özelliğin tüm değerleri için istenen sonucu eşit derecede iyi tahmin edip etmediğini değerlendirmek üzere kullanılan bir adalet metriği. Diğer bir deyişle, bir model için istenen sonuç pozitif sınıf ise tüm gruplar için gerçek pozitif oranının tümü için aynı olması hedeflenir.
Fırsat eşitliği, eşitlenmiş olasılıklar ile ilgilidir. Bu da tüm gruplar için hem doğru pozitif oranlarının hem de yanlış pozitif oranlarının tümü için aynı olmasını gerektirir.
Glubbdubdrib Üniversitesi'nin hem Lilliputluları hem de Brobdingnaglıları zorlu bir matematik programına kabul ettiğini varsayalım. Lilliputluların ortaokullarında matematik derslerinden oluşan kapsamlı bir müfredat uygulanır ve öğrencilerin büyük çoğunluğu üniversite programına katılmaya hak kazanır. Brobdingnag'daki ortaokullarda matematik dersi verilmediği için öğrencilerin çok daha azı bu alanda yeterli bilgiye sahip. Nitelikli öğrenciler, Lilliputlu veya Brobdingnaglı olmalarına bakılmaksızın eşit olasılıkla kabul ediliyorsa milliyet (Lilliputlu veya Brobdingnaglı) açısından "kabul edildi" tercih edilen etiketi için fırsat eşitliği sağlanır.
Örneğin, Glubbdubdrib Üniversitesi'ne 100 Lilliputlu ve 100 Brobdingnaglı başvurduğunu ve kabul kararlarının aşağıdaki gibi verildiğini varsayalım:
Tablo 1. Lilliputian başvuru sahipleri (%90'ı nitelikli)
| Uygun | Uygun Değil | |
|---|---|---|
| Kabul edildi | 45 | 3 |
| Reddedildi | 45 | 7 |
| Toplam | 90 | 10 |
|
Kabul edilen nitelikli öğrenci yüzdesi: 45/90 =%50 Reddedilen niteliksiz öğrenci yüzdesi: 7/10 =%70 Toplamda kabul edilen Lilliputlu öğrenci yüzdesi: (45+3)/100 = %48 |
||
Tablo 2. Brobdingnagian başvuru sahipleri (10'u nitelikli):
| Uygun | Uygun Değil | |
|---|---|---|
| Kabul edildi | 5 | 9 |
| Reddedildi | 5 | 81 |
| Toplam | 10 | 90 |
|
Kabul edilen uygun öğrenci yüzdesi: 5/10 =%50 Reddedilen uygun olmayan öğrenci yüzdesi: 81/90 =%90 Kabul edilen toplam Brobdingnagian öğrenci yüzdesi: (5+9)/100 = %14 |
||
Yukarıdaki örneklerde, hem nitelikli Lilliputluların hem de nitelikli Brobdingnaglıların kabul edilme şansı% 50 olduğundan nitelikli öğrencilerin kabulü için fırsat eşitliği sağlanmaktadır.
Fırsat eşitliği karşılanırken aşağıdaki iki adalet metriği karşılanmaz:
- Demografik eşitlik: Lilliputlular ve Brobdingnaglılar üniversiteye farklı oranlarda kabul ediliyor. Lilliputlu öğrencilerin% 48'i kabul edilirken Brobdingnaglı öğrencilerin yalnızca% 14'ü kabul ediliyor.
- Eşit şans: Hem nitelikli Lilliput hem de Brobdingnag öğrencileri kabul edilme konusunda eşit şansa sahip olsa da niteliksiz Lilliput ve Brobdingnag öğrencilerinin reddedilme konusunda eşit şansa sahip olması şeklindeki ek kısıtlama karşılanmaz. Niteliksiz Lilliputluların reddedilme oranı% 70, niteliksiz Brobdingnaglıların reddedilme oranı ise% 90'dır.
Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Adalet: Fırsat eşitliği bölümüne bakın.
eşitlenmiş oranlar
Bir modelin, pozitif sınıf ve negatif sınıf ile ilgili olarak bir hassas özelliğin tüm değerleri için sonuçları eşit derecede iyi tahmin edip etmediğini değerlendirmek için kullanılan bir adalet metriği. Bu metrik, yalnızca bir sınıfı veya diğer sınıfı değerlendirmez. Başka bir deyişle, tüm gruplar için hem gerçek pozitif oranı hem de yanlış negatif oranı aynı olmalıdır.
Eşitlenmiş olasılık, yalnızca tek bir sınıfın (pozitif veya negatif) hata oranlarına odaklanan fırsat eşitliği ile ilgilidir.
Örneğin, Glubbdubdrib Üniversitesi'nin hem Lilliputluları hem de Brobdingnaglıları zorlu bir matematik programına kabul ettiğini varsayalım. Lilliputluların ortaokullarında matematik derslerinden oluşan sağlam bir müfredat uygulanır ve öğrencilerin büyük çoğunluğu üniversite programına katılmaya hak kazanır. Brobdingnag'daki ortaokullarda matematik dersi verilmediği için çok daha az öğrenci yeterli bilgiye sahip. Başvuru sahibinin Lilliputian veya Brobdingnagian olması fark etmeksizin, nitelikli olması durumunda programa kabul edilme olasılığı eşit, nitelikli olmaması durumunda ise reddedilme olasılığı eşit olduğu sürece eşit fırsat koşulu karşılanmış olur.
Glubbdubdrib Üniversitesi'ne 100 Lilliputlu ve 100 Brobdingnaglı başvurduğunu ve kabul kararlarının aşağıdaki şekilde verildiğini varsayalım:
Tablo 3. Lilliputian başvuru sahipleri (%90'ı nitelikli)
| Uygun | Uygun Değil | |
|---|---|---|
| Kabul edildi | 45 | 2 |
| Reddedildi | 45 | 8 |
| Toplam | 90 | 10 |
|
Kabul edilen uygun öğrenci yüzdesi: 45/90 =%50 Reddedilen uygun olmayan öğrenci yüzdesi: 8/10 =%80 Toplamda kabul edilen Lilliputlu öğrenci yüzdesi: (45+2)/100 = %47 |
||
Tablo 4. Brobdingnagian başvuru sahipleri (10'u nitelikli):
| Uygun | Uygun Değil | |
|---|---|---|
| Kabul edildi | 5 | 18 |
| Reddedildi | 5 | 72 |
| Toplam | 10 | 90 |
|
Kabul edilen nitelikli öğrenci yüzdesi: 5/10 =%50 Reddedilen niteliksiz öğrenci yüzdesi: 72/90 =%80 Kabul edilen Brobdingnagian öğrencilerin toplam yüzdesi: (5+18)/100 = %23 |
||
Nitelikli Lilliput ve Brobdingnag öğrencilerin kabul edilme şansı% 50, niteliksiz Lilliput ve Brobdingnag öğrencilerin reddedilme şansı% 80 olduğundan eşitlenmiş olasılık koşulu karşılanıyor.
Eşitlenmiş olasılık, "Equality of Opportunity in Supervised Learning" adlı makalede şu şekilde tanımlanır: "Ŷ tahmin edicisi, Y koşullu olarak Ŷ ve A bağımsızsa A korumalı özelliği ve Y sonucu açısından eşitlenmiş olasılığı karşılar."
deneyci yanlılığı
Doğrulama yanlılığı konusuna bakın.
C
adalet kısıtlaması
Bir veya daha fazla adalet tanımının karşılanmasını sağlamak için bir algoritmaya kısıtlama uygulama. Adalet kısıtlamalarına örnek olarak aşağıdakiler verilebilir:- Modelinizin çıkışını sonradan işleme.
- Adalet metriğini ihlal etme cezası eklemek için kayıp işlevini değiştirme.
- Doğrudan bir optimizasyon problemine matematiksel kısıtlama ekleme.
adalet metriği
Ölçülebilir bir "adalet" tanımı. Sık kullanılan bazı adalet metrikleri şunlardır:
- eşitlenmiş olasılıklar (equalized odds)
- tahmini eşitlik
- karşıolgusal adalet
- demografik eşitlik
Birçok adalet metriği birbirini dışlar. Adalet metriklerinin uyumsuzluğu başlıklı makaleyi inceleyin.
G
gruba atfetme önyargısı
Bir birey için geçerli olanın o gruptaki herkes için de geçerli olduğunu varsayma. Veri toplama için uygun örnekleme kullanılıyorsa grup ilişkilendirme önyargısının etkileri daha da kötüleşebilir. Temsil edici olmayan bir örnekte, gerçekliği yansıtmayan ilişkilendirmeler yapılabilir.
Ayrıca grup dışı homojenlik önyargısı ve grup içi önyargısı hakkında bilgi edinin. Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Adalet: Önyargı türleri bölümüne de bakın.
H
geçmiş verilerden kaynaklanan önyargı
Dünyada zaten var olan ve bir veri kümesine girmiş bir önyargı türü. Bu önyargılar, mevcut kültürel klişeleri, demografik eşitsizlikleri ve belirli sosyal gruplara yönelik önyargıları yansıtma eğilimindedir.
Örneğin, bir kredi başvurusunda bulunan kişinin kredisini ödeyip ödemeyeceğini tahmin eden bir sınıflandırma modelini ele alalım. Bu model, 1980'lerde iki farklı topluluktaki yerel bankalardan alınan geçmiş kredi temerrüt verileriyle eğitilmiştir. A topluluğundan geçmişteki başvuru sahiplerinin kredilerini ödememe olasılığı B topluluğundan başvuru sahiplerine kıyasla altı kat daha yüksekse model, geçmişteki bir önyargıyı öğrenebilir. Bu durumda, topluluğun daha yüksek temerrüt oranlarına yol açan geçmiş koşullar artık geçerli olmasa bile modelin A topluluğundaki kredileri onaylama olasılığı daha düşük olur.
Daha fazla bilgi için Adalet: Makine Öğrenimi Hızlandırılmış Kursu'nda önyargı türleri başlıklı makaleyi inceleyin.
I
örtülü önyargı
Kişinin zihin modellerine ve anılarına göre otomatik olarak ilişkilendirme veya varsayımda bulunma. Örtülü önyargı aşağıdakileri etkileyebilir:
- Verilerin nasıl toplandığı ve sınıflandırıldığı.
- Makine öğrenimi sistemlerinin nasıl tasarlandığı ve geliştirildiği.
Örneğin, düğün fotoğraflarını belirlemek için sınıflandırma modeli oluştururken bir mühendis, fotoğrafta beyaz elbise olmasını özellik olarak kullanabilir. Ancak beyaz gelinlikler yalnızca belirli dönemlerde ve belirli kültürlerde geleneksel olmuştur.
Ayrıca doğrulama yanlılığı konusuna da bakın.
Adalet metriklerinin uyumsuzluğu
Bazı adalet kavramlarının birbiriyle uyumlu olmadığı ve aynı anda karşılanamayacağı fikri. Sonuç olarak, adalet kavramını ölçmek için tüm makine öğrenimi sorunlarına uygulanabilecek tek bir evrensel metrik yoktur.
Bu durum cesaret kırıcı olsa da adalet metriklerinin uyumsuzluğu, adaletle ilgili çabaların boşuna olduğu anlamına gelmez. Bunun yerine, adalet kavramının belirli bir makine öğrenimi problemi için bağlamsal olarak tanımlanması gerektiğini ve kullanım alanlarına özgü zararların önlenmesinin amaçlandığını belirtir.
Adalet metriklerinin uyumsuzluğuyla ilgili daha ayrıntılı bir tartışma için "On the (im)possibility of fairness" (Adaletin (im)kansızlığı üzerine) başlıklı makaleyi inceleyin.
bireysel adalet
Benzer kişilerin benzer şekilde sınıflandırılıp sınıflandırılmadığını kontrol eden bir adalet metriği. Örneğin, Brobdingnagian Akademisi, aynı notlara ve standart test puanlarına sahip iki öğrencinin kabul edilme olasılığının eşit olmasını sağlayarak bireysel adaleti sağlamak isteyebilir.
Bireysel adalet kavramının tamamen "benzerliği" nasıl tanımladığınıza (bu durumda notlar ve test puanları) bağlı olduğunu ve benzerlik metriğiniz önemli bilgileri (ör. öğrencinin müfredatının zorluğu) kaçırırsa yeni adalet sorunları ortaya çıkarma riskiyle karşılaşabileceğinizi unutmayın.
Bireysel adalet hakkında daha ayrıntılı bilgi için "Farkındalıkla Adalet" başlıklı makaleyi inceleyin.
grup içi önyargı
Kendi grubuna veya kendi özelliklerine karşı taraflı davranma Test kullanıcıları veya değerlendiriciler, makine öğrenimi geliştiricisinin arkadaşları, ailesi ya da iş arkadaşlarıysa grup içi önyargı, ürün testini veya veri kümesini geçersiz kılabilir.
Grup içi önyargısı, bir tür gruba atfetme önyargısıdır. Ayrıca grup dışı homojenlik önyargısı başlıklı makaleyi de inceleyin.
Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Adalet: Önyargı türleri bölümüne bakın.
H
yanıt vermeme önyargısı
Seçim yanlılığı konusunu inceleyin.
O
grup dışı homojenlik önyargısı
Tutumları, değerleri, kişilik özelliklerini ve diğer özellikleri karşılaştırırken grup dışı üyeleri grup içi üyelerden daha benzer görme eğilimi. Grup içi, düzenli olarak etkileşimde bulunduğunuz kişileri; grup dışı ise düzenli olarak etkileşimde bulunmadığınız kişileri ifade eder. Kullanıcılardan grup dışındaki kişilerle ilgili özellikler sağlamalarını isteyerek bir veri kümesi oluşturursanız bu özellikler, katılımcıların kendi gruplarındaki kişiler için listelediği özelliklere kıyasla daha az ayrıntılı ve daha çok klişeleşmiş olabilir.
Örneğin, Lilliputlular diğer Lilliputluların evlerini ayrıntılı bir şekilde açıklayabilir, mimari stiller, pencereler, kapılar ve boyutlardaki küçük farklılıklardan bahsedebilir. Ancak aynı Lilliputlular, Brobdingnaglıların hepsinin aynı evde yaşadığını iddia edebilir.
Grup dışı homojenlik önyargısı, bir gruba atfetme önyargısı türüdür.
Ayrıca grup içi önyargı konusuna da bakın.
P
katılım önyargısı
Yanıt vermeme yanlılığı için eş anlamlıdır. Seçim yanlılığı konusunu inceleyin.
işleme sonrası
Model çalıştırıldıktan sonra modelin çıktısını ayarlama. Modellerin kendilerini değiştirmeden adalet kısıtlamalarını zorunlu kılmak için sonradan işleme kullanılabilir.
Örneğin, bir ikili sınıflandırma modeline, sınıflandırma eşiği ayarlanarak son işlem uygulanabilir. Bu sayede, gerçek pozitif oranının söz konusu özelliğin tüm değerleri için aynı olduğu kontrol edilerek bazı özellikler için fırsat eşitliği korunur.
tahmini eşitlik
Belirli bir sınıflandırma modeli için dikkate alınan alt gruplarda hassasiyet oranlarının eşdeğer olup olmadığını kontrol eden bir adalet metriği.
Örneğin, üniversite kabulünü tahmin eden bir model, Lilliputlular ve Brobdingnaglılar için kesinlik oranı aynıysa milliyet açısından tahmini eşitliği karşılar.
Tahmini fiyat paritesi bazen tahmini oran paritesi olarak da adlandırılır.
Tahmini eşitlik hakkında daha ayrıntılı bilgi için "Adalet Tanımları Açıklaması" (bölüm 3.2.1) başlıklı makaleyi inceleyin.
tahmini fiyat eşitliği
Tahmini eşlik için kullanılan başka bir ad.
ön işleme
Verileri, model eğitiminde kullanılmadan önce işleme Ön işleme, İngilizce metin korpusundaki İngilizce sözlükte yer almayan kelimeleri kaldırmak kadar basit veya veri noktalarını hassas özelliklerle ilişkili mümkün olduğunca çok sayıda özelliği ortadan kaldıracak şekilde yeniden ifade etmek kadar karmaşık olabilir. Ön işleme, adalet kısıtlamalarını karşılamaya yardımcı olabilir.provenance
Bir dijital medya içeriğinin nasıl oluşturulduğunu veya değiştirildiğini ayrıntılı olarak açıklayan veriler.
proxy (hassas özellikler)
Hassas bir özelliğin yerine kullanılan bir özellik. Örneğin, bir bireyin posta kodu, gelirinin, ırkının veya etnik kökeninin yerine kullanılabilir.R
bildirme önyargısı
Kullanıcıların eylemler, sonuçlar veya özellikler hakkında yazma sıklığının, bunların gerçek hayattaki sıklığını ya da bir özelliğin bir kişi sınıfı için ne kadar karakteristik olduğunu yansıtmaması. Raporlama yanlılığı, makine öğrenimi sistemlerinin öğrendiği verilerin yapısını etkileyebilir.
Örneğin, kitaplarda güldü kelimesi nefes aldı kelimesinden daha yaygındır. Bir kitap derlemesinde gülme ve nefes alma sıklığını tahmin eden bir makine öğrenimi modeli, gülmenin nefes almaktan daha yaygın olduğunu belirleyebilir.
Daha fazla bilgi için Makine Öğrenimi Hızlandırılmış Kursu'ndaki Adalet: Yanlılık Türleri bölümüne bakın.
G
örnekleme yanlılığı
Seçim yanlılığı konusunu inceleyin.
seçim yanlılığı
Verilerde gözlemlenen örnekler ile gözlemlenmeyen örnekler arasında sistematik farklılıklar oluşturan bir seçim süreci nedeniyle örneklenmiş verilerden çıkarılan sonuçlardaki hatalar. Aşağıdaki seçim yanlılığı türleri vardır:
- Kapsam yanlılığı: Veri kümesinde temsil edilen popülasyon, makine öğrenimi modelinin tahminlerde bulunduğu popülasyonla eşleşmiyor.
- Örnekleme önyargısı: Veriler, hedef gruptan rastgele toplanmaz.
- Yanıt vermeme yanlılığı (katılım yanlılığı olarak da adlandırılır): Belirli gruplardaki kullanıcılar, diğer gruplardaki kullanıcılara kıyasla anketlere farklı oranlarda katılmayı reddeder.
Örneğin, insanların bir filmden ne kadar keyif alacağını tahmin eden bir makine öğrenimi modeli oluşturduğunuzu varsayalım. Eğitim verilerini toplamak için, filmin gösterildiği bir tiyatronun ön sırasındaki herkese anket dağıtıyorsunuz. Bu, ilk bakışta veri kümesi toplamak için makul bir yöntem gibi görünebilir. Ancak bu veri toplama biçimi, aşağıdaki seçim önyargısı biçimlerine yol açabilir:
- kapsam yanlılığı: Filmi izlemeyi seçen bir popülasyondan örnekleme yaptığınız için modelinizin tahminleri, filme bu düzeyde ilgi göstermeyen kişiler için genellenemeyebilir.
- Örneklem yanlılığı: Amaçlanan kitle (sinemadaki tüm insanlar) arasından rastgele örnekleme yapmak yerine yalnızca ön sıradaki insanları örneklediniz. Ön sırada oturanlar, diğer sıralarda oturanlara kıyasla filmle daha fazla ilgilenmiş olabilir.
- Yanıt vermeme yanlılığı: Genel olarak, güçlü görüşleri olan kişiler isteğe bağlı anketlere, görüşleri daha hafif olan kişilere göre daha sık yanıt verir. Film anketi isteğe bağlı olduğundan yanıtların normal (çan eğrisi şeklinde) dağılım yerine iki modlu dağılım oluşturma olasılığı daha yüksektir.
hassas nitelik
Yasal, etik, sosyal veya kişisel nedenlerle özel olarak nitelendirilmiş bir insan özelliği.U
farkında olmama (hassas bir özellik için)
Hassas özelliklerin mevcut olduğu ancak eğitim verilerine dahil edilmediği durum. Hassas özellikler genellikle verilerin diğer özellikleriyle ilişkili olduğundan, hassas bir özellikten habersiz olarak eğitilen bir model, bu özellik açısından yine de eşitsiz etkiye sahip olabilir veya diğer adalet kısıtlamalarını ihlal edebilir.