مجموعه اعتبارسنجی: شهود خود را بررسی کنید

قبل از شروع این ماژول، در نظر بگیرید که آیا در استفاده از فرآیند آموزشی ذکر شده در مجموعه‌های آموزشی و تست، اشکالی وجود دارد یا خیر.

گزینه های زیر را بررسی کنید.

ما به فرآیند استفاده از یک مجموعه تست و یک مجموعه آموزشی برای هدایت تکرارهای توسعه مدل نگاه کردیم. در هر تکرار، داده‌های آموزشی را آموزش می‌دهیم و داده‌های آزمون را ارزیابی می‌کنیم، با استفاده از نتایج ارزیابی روی داده‌های آزمون برای هدایت انتخاب‌ها و تغییرات در ابرپارامترهای مدل مختلف مانند نرخ یادگیری و ویژگی‌ها. آیا این رویکرد اشکالی دارد؟ (فقط یک پاسخ را انتخاب کنید.)
کاملاً خوب است، ما در حال آموزش در مورد داده های آموزشی و ارزیابی داده های آزمون جداگانه و نگهداری شده هستیم.
در واقع، یک مسئله ظریف در اینجا وجود دارد. به این فکر کنید که اگر تکرارهای بسیار زیادی از این فرم انجام دهیم چه اتفاقی می افتد.
انجام دورهای زیادی از این روش ممکن است باعث شود که ما به طور ضمنی با ویژگی‌های مجموعه آزمایشی خاص خود سازگار شویم.
بله واقعا! هر چه بیشتر در یک مجموعه تست معین ارزیابی کنیم، بیشتر در معرض خطر تطبیق بیش از حد ضمنی با آن مجموعه تست هستیم. در ادامه پروتکل بهتری را بررسی خواهیم کرد.
این از نظر محاسباتی ناکارآمد است. ما فقط باید یک مجموعه پیش فرض از هایپرپارامترها را انتخاب کنیم و با آنها زندگی کنیم تا منابع را ذخیره کنیم.
اگرچه این نوع تکرارها گران هستند، اما بخش مهمی از توسعه مدل هستند. تنظیمات فراپارامتر می تواند تفاوت زیادی در کیفیت مدل ایجاد کند، و ما همیشه باید مقداری زمان و منابع محاسباتی را در نظر بگیریم تا مطمئن شویم که بهترین کیفیت را دریافت می کنیم.