ماژول قبلی مفهوم ضرر را معرفی کرد. در اینجا، در این ماژول، خواهید آموخت که چگونه یک مدل یادگیری ماشینی به طور مکرر ضرر را کاهش می دهد.
یادگیری تکراری ممکن است شما را به یاد بازی کودکانه "سرد و گرم" برای یافتن یک شی پنهان مانند انگشتانه بیاندازد. در این بازی «شیء پنهان» بهترین مدل ممکن است. شما با یک حدس وحشی شروع خواهید کرد ("مقدار \(w_1\) 0 است.") و منتظر بمانید تا سیستم به شما بگوید ضرر چقدر است. سپس، حدس دیگری را امتحان خواهید کرد ("مقدار \(w_1\) 0.5 است.") و ببینید ضرر چقدر است. آهان، شما گرمتر می شوید. در واقع، اگر این بازی را درست انجام دهید، معمولاً گرمتر می شوید. ترفند واقعی بازی این است که سعی کنید بهترین مدل ممکن را به بهترین نحو ممکن پیدا کنید.
شکل زیر فرآیند تکراری آزمون و خطا را نشان می دهد که الگوریتم های یادگیری ماشین برای آموزش یک مدل از آن استفاده می کنند:
شکل 1. یک رویکرد تکراری برای آموزش یک مدل.
ما از همین رویکرد تکراری در سرتاسر دوره آموزشی Crash Learning Machine استفاده خواهیم کرد و پیچیدگیهای مختلف را بهویژه در آن ابر طوفانی با عنوان «مدل (عملکرد پیشبینی)» شرح میدهد. استراتژیهای تکراری در یادگیری ماشین رایج هستند، در درجه اول به این دلیل که آنها به خوبی در مجموعه دادههای بزرگ مقیاس میشوند.
"مدل" یک یا چند ویژگی را به عنوان ورودی می گیرد و یک پیش بینی را به عنوان خروجی برمی گرداند. برای سادهتر کردن، مدلی را در نظر بگیرید که یک ویژگی (\(x_1\)) و یک پیشبینی را برمیگرداند (\(y'\)):
چه مقادیر اولیه ای را برای \(b\)و \(w_1\)تنظیم کنیم؟ برای مسائل رگرسیون خطی، معلوم می شود که مقادیر شروع مهم نیستند. ما میتوانیم مقادیر تصادفی را انتخاب کنیم، اما به جای آن فقط مقادیر بیاهمیت زیر را انتخاب میکنیم:
- \(b\) = 0
- \(w_1\) = 0
فرض کنید که اولین مقدار مشخصه 10 باشد. با وصل کردن آن مقدار ویژگی به تابع پیش بینی به دست می آید:
بخش "محاسبه ضرر" نمودار تابع ضرر است که مدل از آن استفاده خواهد کرد. فرض کنید از تابع تلفات مربع استفاده می کنیم. تابع ضرر در دو مقدار ورودی می گیرد:
- \(y'\): پیش بینی مدل برای ویژگی های x
- \(y\): برچسب صحیح مربوط به ویژگی های x .
سرانجام، به بخش «محاسبه بهروزرسانیهای پارامتر» از نمودار رسیدیم. اینجاست که سیستم یادگیری ماشینی مقدار تابع ضرر را بررسی میکند و مقادیر جدیدی برای \(b\) و \(w_1\)تولید میکند. در حال حاضر، فقط فرض کنید که این جعبه مرموز مقادیر جدیدی ابداع می کند و سپس سیستم یادگیری ماشینی همه آن ویژگی ها را در برابر همه آن برچسب ها مجددا ارزیابی می کند و یک مقدار جدید برای تابع ضرر به دست می دهد که مقادیر پارامترهای جدیدی را به دست می دهد. و یادگیری به تکرار ادامه میدهد تا زمانی که الگوریتم پارامترهای مدل را با کمترین تلفات ممکن کشف کند. معمولاً تا زمانی که ضرر کلی متوقف شود یا حداقل به کندی تغییر کند آن را تکرار می کنید. وقتی این اتفاق می افتد، می گوییم که مدل همگرا شده است.