تحديد انحياز البيانات

وعندما تمكّن الفريق المسؤول عن Jigsaw من تقييم نموذج التسمم في واجهة برمجة التطبيقات Perspective، وجد أنّ أداءها جيدًا في مجموعة البيانات التجريبية. ولكن كان هناك مخاوف بشأن الاحتمال المحتمل أن يظهر الانحياز في نموذج التوقعات في حال وجود أي أخطاء منهجية في بيانات التدريب. لضمان جودة بيانات التدريب، اتّخذ الفريق خطوة إضافية لفحص التصنيفات التي قدّمها خبراء التصنيف لضمان دقتها.

ومع ذلك، بالرغم من اتخاذ هذه الخطوات الاستباقية للقضاء على الانحياز في بيانات التدريب على النموذج ، لا يزال المستخدمون يكشفون عن مشكلة موجبة خاطئة للتعليقات التي تحتوي على عبارات تعريف الهوية. كيف حدث ذلك؟

كشفت تدقيق آخر لمجموعة التدريب أن معظم التعليقات التي تحتوي على عبارات هوية للعِرق والدين والجنس مُصنّفة بأنها سامة. كانت هذه التصنيفات صحيحة، كانت معظم التعليقات على الإنترنت التي تحتوي على عبارات الهوية هذه سامة حقًا. ونتيجة لهذا الانحراف، تعلّم النموذج وجود علاقة بين وجود مصطلحات الهوية هذه والسكون، ما لم يعكس بدقة اللفظة المحايدة من المصطلحات ذاتها.

وكشف الفريق عن فجوة مهمة في بيانات التدريب في النموذج: وهي مجال لم تتوفر فيه بيانات تدريبية كافية لتمثيل أحد جوانب الواقع. لم تحتوي مجموعة التدريب على أمثلة كافية عن تعليقات غير مفهومة عن النموذج عرفت أن العبارات نفسها محايدة وأن السياق الذي تم استخدامها فيه هو المهم.