برازش بیش از حد: تفسیر منحنی های ضرر

اگر اولین باری که مدل خود را آموزش دادید، تمام منحنی های ضرر شما به این شکل باشد، یادگیری ماشین بسیار ساده تر خواهد بود:

شکل 20. نموداری که منحنی تلفات ایده آل را هنگام تمرین نشان می دهد             مدل یادگیری ماشینی منحنی ضرر، افت را روی محور y ترسیم می کند             در برابر تعداد مراحل تمرین در محور x. به عنوان شماره             مراحل تمرین افزایش می یابد، ضرر شروع می شود زیاد، سپس کاهش می یابد             به صورت تصاعدی، و در نهایت مسطح می شود تا به حداقل برسد             از دست دادن
شکل 20. منحنی تلفات ایده آل.

متأسفانه، تفسیر منحنی های ضرر اغلب چالش برانگیز است. از شهود خود در مورد منحنی های ضرر برای حل تمرین های این صفحه استفاده کنید.

تمرین 1: منحنی تلفات نوسانی

شکل 21. منحنی ضرر (از دست دادن در محور y؛ تعداد تمرین             پله‌هایی روی محور x) که در آن‌ها ضرر کاهش نمی‌یابد.             در عوض، ضرر به طور نامنظم در نوسان است.
شکل 21. منحنی تلفات نوسانی.
برای بهبود منحنی ضرر نشان داده شده در شکل 21 چه سه کاری می توانید انجام دهید؟
داده های خود را در مقابل یک طرح داده بررسی کنید تا نمونه های بد را شناسایی کنید و سپس نمونه های بد را از مجموعه آموزشی حذف کنید.
بله، این یک تمرین خوب برای همه مدل ها است.
نرخ یادگیری را کاهش دهید.
بله، کاهش نرخ یادگیری اغلب هنگام رفع اشکال یک مشکل آموزشی ایده خوبی است.
مجموعه آموزشی را به تعداد کمی از نمونه های قابل اعتماد کاهش دهید.
اگرچه این تکنیک مصنوعی به نظر می رسد، اما در واقع ایده خوبی است. با فرض اینکه مدل بر روی مجموعه کوچکی از نمونه های قابل اعتماد همگرا می شود، سپس می توانید به تدریج مثال های بیشتری اضافه کنید، شاید کشف کنید که کدام مثال ها باعث نوسان منحنی ضرر می شوند.
تعداد نمونه های مجموعه آموزشی را افزایش دهید.
این یک ایده وسوسه انگیز است، اما بسیار بعید است که مشکل را حل کند.
نرخ یادگیری را افزایش دهید.
به طور کلی، زمانی که منحنی یادگیری یک مدل مشکلی را نشان می دهد، از افزایش نرخ یادگیری خودداری کنید.

تمرین 2. منحنی باخت با یک پرش تند

شکل 22. نمودار منحنی ضرر که کاهش تلفات را تا a نشان می دهد             تعداد معینی از مراحل آموزشی و سپس به طور ناگهانی افزایش می یابد             با مراحل آموزشی بیشتر
شکل 22. افزایش شدید ضرر.
کدام یک از عبارات زیر دلایل احتمالی تلفات انفجاری نشان داده شده در شکل 22 را مشخص می کند؟
داده های ورودی حاوی یک یا چند NaN هستند - برای مثال، مقداری که در اثر تقسیم بر صفر ایجاد می شود.
این شایع تر از چیزی است که شما انتظار دارید.
داده های ورودی حاوی مجموعه ای از مقادیر پرت است.
گاهی اوقات، به دلیل جابجایی نادرست دسته ها، یک دسته ممکن است دارای مقادیر پرت زیادی باشد.
نرخ یادگیری بسیار پایین است.
نرخ یادگیری بسیار پایین ممکن است زمان تمرین را افزایش دهد، اما دلیل منحنی ضرر عجیب نیست.
نرخ منظم سازی خیلی زیاد است.
درست است، یک منظم سازی بسیار بالا می تواند از همگرایی یک مدل جلوگیری کند. با این حال، منحنی تلفات عجیب نشان داده شده در شکل 22 را ایجاد نمی کند.

تمرین 3. از دست دادن تست با از دست دادن تمرین متفاوت است

شکل 23. منحنی از دست دادن تمرین به نظر می رسد همگرا باشد، اما             کاهش اعتبار پس از تعداد معینی از آموزش شروع به افزایش می کند             مراحل
شکل 23. افزایش شدید از دست دادن اعتبار.
کدام یک از عبارات زیر دلیل این تفاوت بین منحنی های ضرر مجموعه های آموزشی و آزمایشی را به بهترین نحو مشخص می کند؟
مدل بیش از حد به مجموعه آموزشی تناسب دارد.
بله، احتمالاً همینطور است. راه حل های ممکن:
  • مدل را ساده‌تر کنید، احتمالاً با کاهش تعداد ویژگی‌ها.
  • نرخ منظم سازی را افزایش دهید.
  • اطمینان حاصل کنید که مجموعه آموزشی و مجموعه تست از نظر آماری معادل هستند.
نرخ یادگیری خیلی بالاست.
اگر نرخ یادگیری خیلی بالا بود، منحنی ضرر برای مجموعه آموزشی احتمالاً مانند آن رفتار نمی کرد.

تمرین 4. منحنی ضرر گیر می کند

شکل 24. نمودار یک منحنی ضرر که شروع زیان را نشان می دهد             با آموزش همگرا می شوند اما سپس الگوهای تکراری را نشان می دهند که             شبیه یک موج مستطیل شکل
شکل 24. از دست دادن آشفته پس از تعداد معینی از مراحل.
کدام یک از عبارات زیر محتمل ترین توضیح برای منحنی زیان نامنظم نشان داده شده در شکل 24 است؟
مجموعه آموزشی به خوبی مخلوط نشده است.
این یک احتمال است. به عنوان مثال، یک مجموعه آموزشی که شامل 100 تصویر از سگ و به دنبال آن 100 تصویر از گربه است، ممکن است باعث نوسان از دست دادن هنگام آموزش مدل شود. مطمئن شوید که مثال‌ها را به‌اندازه کافی به هم ریخته‌اید.
نرخ منظم سازی خیلی زیاد است.
بعید است که این دلیل باشد.
مجموعه آموزشی دارای ویژگی های بسیار زیادی است.
بعید است که این دلیل باشد.