ML Practicum: Fairness in Perspective API

با توسعه Perspective API که از یادگیری ماشینی برای شناسایی نظرات سمی استفاده می‌کند، بیاموزید که چگونه تیم Jigsaw با همکاری تیم فناوری مقابله با سوء استفاده Google با آزار و اذیت آنلاین مقابله کرد. سپس، از شاخص‌های انصاف برای ارزیابی مدل‌های ML و کمک به کاهش سوگیری ناخواسته در داده‌های آموزشی استفاده کنید.

مقدمه

Jigsaw واحدی در Alphabet است که فناوری ایجاد می کند تا جهان را ایمن تر کند. در سال 2017، تیم شروع به رسیدگی به آزار و اذیت آنلاین کرد و Perspective API را توسعه داد. هدف Perspective API افزایش مشارکت، کیفیت و همدلی مکالمه آنلاین در مقیاس است. توسعه‌دهندگان و ناشران می‌توانند از پرسپکتیو برای شناسایی و فیلتر کردن متنی استفاده کنند که از گفتگوی سازنده در انجمن‌های آنلاین با تجزیه و تحلیل محتوای نظرات برای متن‌های احتمالی توهین‌آمیز، از جمله تهدید، توهین، فحاشی، و زبان سمی جلوگیری می‌کند.

Perspective API متن نظر را به عنوان ورودی دریافت می کند و یک "امتیاز" را از 0 به 1 برمی گرداند که نشان دهنده احتمال شبیه بودن نظر به نظرات سمی است که در گذشته دیده شده است. نمره 0 به معنی 0٪ احتمال سمی بودن نظر، نمره 1 نشان دهنده احتمال 100٪ سمی بودن نظر و نمره 0.5 نشان دهنده احتمال 50٪ سمی بودن نظر است (یعنی مدل مطمئن نیستم).

بیان مسأله

پس از راه‌اندازی اولیه Perspective API، کاربران خارجی همبستگی مثبتی بین اصطلاحات هویت حاوی اطلاعات نژاد یا گرایش جنسی و نمره سمیت کشف کردند. به عنوان مثال، عبارت "من یک زن سیاهپوست همجنسگرا هستم" نمره سمیت 0.87 را دریافت کرد. در این مورد، اصطلاحات هویت به صورت تحقیرآمیز مورد استفاده قرار نمی‌گرفتند، بنابراین این مثال به اشتباه طبقه‌بندی شد. کجا همه چیز اشتباه شد؟