फ़ेयरनेस: बायस के टाइप

मशीन लर्निंग मॉडल का मकसद आसानी से नहीं होता. इंजीनियर, मॉडल को ट्रेनिंग के उदाहरण देकर और इस डेटा के प्रावधानों को चुनकर, लोगों को ट्रेनिंग देते हैं. साथ ही, मॉडल के चुनाव को लेकर किसी भी तरह के अनुमान या भेदभाव को लेकर परेशानी हो सकती है.

मॉडल बनाते समय, आपको मानव भेदभावों के बारे में जानकारी होनी चाहिए. साथ ही, यह भी ज़रूरी है कि वे आपके डेटा को बेहतर तरीके से समझ पाएं, ताकि आप उसके असर को कम कर सकें.

रिपोर्टिंग बायस

रिपोर्टिंग बायस तब होता है, जब किसी डेटा सेट में कैप्चर किए गए इवेंट, प्रॉपर्टी, और/या नतीजों की फ़्रीक्वेंसी, असल में होने वाली फ़्रीक्वेंसी को सही तरीके से नहीं दिखाती है. यह भेदभाव तब हो सकता है, जब लोग असामान्य या खास तौर पर याद रखने वाली स्थितियों पर दस्तावेज़ बनाने पर ध्यान देते हैं. वे यह मानते हुए कि सामान्य तौर पर, लोग बिना बोले कहा और जा सकते हैं."

ऑटोमेशन बायस

ऑटोमेशन बायस ऑटोमेटेड सिस्टम से जनरेट किए गए उन नतीजों का पता लगाता है जो ऑटोमेटेड सिस्टम से जनरेट होते हैं. भले ही, हर सिस्टम में गड़बड़ी की कोई भी दर न हो.

बायस चुनें

सिलेक्शन बायस तब होती है, जब किसी डेटा सेट के उदाहरण इस तरह से चुने जाते हैं कि वे असल में लोगों के लिए उपलब्ध न हों. चुनने का मापदंड कई तरह से बनाया जा सकता है:

  • कवरेज से जुड़ा मापदंड: डेटा को प्रतिनिधि तरीके से नहीं चुना जाता.
  • नॉन-रिस्पॉन्स बायस (या पार्टिसिप बायस): डेटा इकट्ठा करने की प्रोसेस में, भागीदारी के दौरान कम डेटा दिखता है.
  • सैंपलिंग बायस: डेटा इकट्ठा करने के दौरान, किसी भी क्रम में लगाने की सुविधा का इस्तेमाल नहीं किया जाता.

ग्रुप एट्रिब्यूशन बायस

ग्रुप एट्रिब्यूशन में भेदभाव से यह पता चलता है कि किसी व्यक्ति के पूरे समूह के लिए क्या सही है. इस भेदभाव की दो मुख्य बातें हैं:

  • इन-ग्रुप बायस: किसी ग्रुप के ऐसे सदस्यों की पसंद जो आप भी हैं या उन एट्रिब्यूट से जुड़ी हैं जिन्हें आप भी शेयर करते हैं.
  • ग्रुप के बाहर होने वाले ग्रुप का एक जैसा भेदभाव: किसी ग्रुप के अलग-अलग सदस्यों की रूढ़िवादी सोच को बढ़ावा देने की कोशिश करते हैं. जैसे, आप उनसे सहमत नहीं हैं या किसी ग्रुप के सदस्यों की पसंद को एक जैसा मानते हैं.

इम्प्लिसिट बायस

इंप्लिसिट बायस तब होता है, जब किसी एक व्यक्ति के मानसिक मॉडल और निजी अनुभवों पर आधारित अनुमान लगाए जाते हैं. हालांकि, ये ज़रूरी नहीं कि वे आम तौर पर लागू होते हों.

इंप्लिसिट बायस का एक सामान्य तरीका पुष्टि करने के लिए किया जाने वाला बायस है. इसमें, मॉडल बनाने वाली कंपनियां अनजाने में डेटा को इस तरह प्रोसेस करती हैं कि वे पहले से मौजूद मान्यताओं और अनुमानों को स्वीकार करते हैं. कुछ मामलों में, मॉडल बिल्डर असल में किसी ट्रेनिंग को तब तक बनाए रख सकता है, जब तक वह ऐसा नतीजा नहीं देता जो उसकी मूल हाइपोथीसिस के हिसाब से हो; इसे प्रयोगकर्ता का भेदभाव कहा जाता है.