این ماژول نشان میدهد که چگونه میتوان از رگرسیون لجستیک برای کارهای طبقهبندی استفاده کرد، و چگونگی ارزیابی اثربخشی مدلهای طبقهبندی را بررسی میکند.
طبقه بندی
طبقه بندی در مقابل رگرسیون
- گاهی اوقات، ما از رگرسیون لجستیک برای خروجی های احتمال استفاده می کنیم - این یک رگرسیون در (0، 1) است.
- در زمانهای دیگر، مقدار یک طبقهبندی باینری گسسته را در آستانه تعیین میکنیم
- انتخاب آستانه انتخاب مهمی است و می توان آن را تنظیم کرد
معیارهای ارزیابی: دقت
- چگونه مدل های طبقه بندی را ارزیابی می کنیم؟
معیارهای ارزیابی: دقت
- چگونه مدل های طبقه بندی را ارزیابی می کنیم؟
- یک معیار ممکن: دقت
- کسری از پیش بینی های ما درست بود
دقت می تواند گمراه کننده باشد
- در بسیاری از موارد، دقت یک معیار ضعیف یا گمراه کننده است
- اغلب زمانی که انواع اشتباهات هزینه های متفاوتی دارند
- مورد معمولی شامل عدم تعادل طبقاتی است، زمانی که موارد مثبت یا منفی بسیار نادر هستند
مثبت های واقعی و مثبت های کاذب
- برای مشکلات کلاس نامتعادل، برای تفکیک انواع مختلف خطاها مفید است
نکات مثبت واقعی ما به درستی به نام گرگ! ما شهر را نجات دادیم. | مثبت های کاذب خطا: ما به دروغ به گرگ زنگ زدیم. همه از ما عصبانی هستند. |
منفی های کاذب یک گرگ بود، اما ما متوجه نشدیم. همه جوجه های ما را خورد. | منفی های واقعی نه گرگ، نه زنگ خطر. همه خوبن |
معیارهای ارزیابی: دقت و یادآوری
- دقت: (مثبت های واقعی) / (همه پیش بینی های مثبت)
- وقتی مدل گفت کلاس "مثبت" درست بود؟
- شهود: آیا مدل خیلی اوقات گریه "گرگ" می کرد؟
معیارهای ارزیابی: دقت و یادآوری
- دقت: (مثبت های واقعی) / (همه پیش بینی های مثبت)
- وقتی مدل گفت کلاس "مثبت" درست بود؟
- شهود: آیا مدل خیلی اوقات گریه "گرگ" می کرد؟
- یادآوری : (مثبت واقعی) / (همه موارد مثبت واقعی)
- از بین تمام نکات مثبت ممکن، مدل چند مورد را به درستی شناسایی کرد؟
- شهود: آیا هیچ گرگ را از دست داده است؟
پس از پایان کار، برای ادامه، play ▶ را فشار دهید
گزینه های زیر را بررسی کنید.
یک مدل طبقه بندی را در نظر بگیرید که ایمیل را به دو دسته تقسیم می کند: "هرزنامه" یا "غیر هرزنامه". اگر آستانه طبقه بندی را افزایش دهید، چه اتفاقی برای دقت می افتد؟
قطعا افزایش می یابد.
افزایش آستانه طبقه بندی معمولاً دقت را افزایش می دهد. با این حال، با افزایش آستانه، دقت تضمین نمی شود که به طور یکنواخت افزایش یابد.
احتمالا افزایش یابد.
به طور کلی، بالا بردن آستانه طبقه بندی، مثبت کاذب را کاهش می دهد و در نتیجه دقت را افزایش می دهد.
احتمالا کاهش یافته است.
به طور کلی، بالا بردن آستانه طبقه بندی، مثبت کاذب را کاهش می دهد و در نتیجه دقت را افزایش می دهد.
قطعا کاهش می یابد.
به طور کلی، بالا بردن آستانه طبقه بندی، مثبت کاذب را کاهش می دهد و در نتیجه دقت را افزایش می دهد.
یک منحنی ROC
هر نقطه نرخ TP و FP در یک آستانه تصمیم گیری است.
معیارهای ارزیابی: AUC
- AUC: "ناحیه زیر منحنی ROC"
معیارهای ارزیابی: AUC
- AUC: "ناحیه زیر منحنی ROC"
- تفسیر:
- اگر یک مثبت تصادفی و یک منفی تصادفی انتخاب کنیم، احتمال اینکه مدل من آنها را به ترتیب صحیح رتبه بندی کند چقدر است؟
معیارهای ارزیابی: AUC
- AUC: "ناحیه زیر منحنی ROC"
- تفسیر:
- اگر یک مثبت تصادفی و یک منفی تصادفی انتخاب کنیم، احتمال اینکه مدل من آنها را به ترتیب صحیح رتبه بندی کند چقدر است؟
- شهود: یک معیار کلی از عملکرد جمع آوری شده در تمام آستانه های طبقه بندی ممکن را ارائه می دهد.
تعصب پیش بینی
- پیشبینیهای رگرسیون لجستیک باید بیطرفانه باشد.
- میانگین پیش بینی ها == میانگین مشاهدات
تعصب پیش بینی
- پیشبینیهای رگرسیون لجستیک باید بیطرفانه باشد.
- میانگین پیش بینی ها == میانگین مشاهدات
- تعصب قناری است.
- سوگیری صفر به تنهایی به این معنی نیست که همه چیز در سیستم شما کامل است.
- اما این یک بررسی سلامت عقل عالی است.
سوگیری پیش بینی (ادامه دارد)
- اگر تعصب دارید، مشکل دارید.
- مجموعه ویژگی های ناقص؟
- خط لوله باگ؟
- نمونه آموزش مغرضانه؟
- بایاس را با لایه کالیبراسیون رفع نکنید، آن را در مدل ثابت کنید.
- به دنبال سوگیری در تکههای داده بگردید - این میتواند به بهبودها کمک کند.