کاهش ضرر: یک رویکرد تکراری

ماژول قبلی مفهوم ضرر را معرفی کرد. در اینجا، در این ماژول، خواهید آموخت که چگونه یک مدل یادگیری ماشینی به طور مکرر ضرر را کاهش می دهد.

یادگیری تکراری ممکن است شما را به یاد بازی کودکانه "سرد و گرم" برای یافتن یک شی پنهان مانند انگشتانه بیاندازد. در این بازی «شیء پنهان» بهترین مدل ممکن است. شما با یک حدس وحشی شروع خواهید کرد ("مقدار \(w_1\) 0 است.") و منتظر بمانید تا سیستم به شما بگوید ضرر چقدر است. سپس، حدس دیگری را امتحان خواهید کرد ("مقدار \(w_1\) 0.5 است.") و ببینید ضرر چقدر است. آهان، شما گرمتر می شوید. در واقع، اگر این بازی را درست انجام دهید، معمولاً گرمتر می شوید. ترفند واقعی بازی این است که سعی کنید بهترین مدل ممکن را به بهترین نحو ممکن پیدا کنید.

شکل زیر فرآیند تکراری آزمون و خطا را نشان می دهد که الگوریتم های یادگیری ماشین برای آموزش یک مدل از آن استفاده می کنند:

چرخه حرکت از ویژگی ها و برچسب ها به مدل ها و پیش بینی ها.

شکل 1. یک رویکرد تکراری برای آموزش یک مدل.

ما از همین رویکرد تکراری در سرتاسر دوره آموزشی Crash Learning Machine استفاده خواهیم کرد و پیچیدگی‌های مختلف را به‌ویژه در آن ابر طوفانی با عنوان «مدل (عملکرد پیش‌بینی)» شرح می‌دهد. استراتژی‌های تکراری در یادگیری ماشین رایج هستند، در درجه اول به این دلیل که آنها به خوبی در مجموعه داده‌های بزرگ مقیاس می‌شوند.

"مدل" یک یا چند ویژگی را به عنوان ورودی می گیرد و یک پیش بینی را به عنوان خروجی برمی گرداند. برای ساده‌تر کردن، مدلی را در نظر بگیرید که یک ویژگی (\(x_1\)) و یک پیش‌بینی را برمی‌گرداند (\(y'\)):

$$ y' = b + w_1x_1 $$

چه مقادیر اولیه ای را برای \(b\)و \(w_1\)تنظیم کنیم؟ برای مسائل رگرسیون خطی، معلوم می شود که مقادیر شروع مهم نیستند. ما می‌توانیم مقادیر تصادفی را انتخاب کنیم، اما به جای آن فقط مقادیر بی‌اهمیت زیر را انتخاب می‌کنیم:

  • \(b\) = 0
  • \(w_1\) = 0

فرض کنید که اولین مقدار مشخصه 10 باشد. با وصل کردن آن مقدار ویژگی به تابع پیش بینی به دست می آید:

$$ y' = 0 + 0 \cdot 10 = 0 $$

بخش "محاسبه ضرر" نمودار تابع ضرر است که مدل از آن استفاده خواهد کرد. فرض کنید از تابع تلفات مربع استفاده می کنیم. تابع ضرر در دو مقدار ورودی می گیرد:

  • \(y'\): پیش بینی مدل برای ویژگی های x
  • \(y\): برچسب صحیح مربوط به ویژگی های x .

سرانجام، به بخش «محاسبه به‌روزرسانی‌های پارامتر» از نمودار رسیدیم. اینجاست که سیستم یادگیری ماشینی مقدار تابع ضرر را بررسی می‌کند و مقادیر جدیدی برای \(b\) و \(w_1\)تولید می‌کند. در حال حاضر، فقط فرض کنید که این جعبه مرموز مقادیر جدیدی ابداع می کند و سپس سیستم یادگیری ماشینی همه آن ویژگی ها را در برابر همه آن برچسب ها مجددا ارزیابی می کند و یک مقدار جدید برای تابع ضرر به دست می دهد که مقادیر پارامترهای جدیدی را به دست می دهد. و یادگیری به تکرار ادامه می‌دهد تا زمانی که الگوریتم پارامترهای مدل را با کمترین تلفات ممکن کشف کند. معمولاً تا زمانی که ضرر کلی متوقف شود یا حداقل به کندی تغییر کند آن را تکرار می کنید. وقتی این اتفاق می افتد، می گوییم که مدل همگرا شده است.