مجموعه اعتبارسنجی

تقسیم یک مجموعه داده به یک مجموعه آموزشی و مجموعه تست به شما امکان می دهد قضاوت کنید که آیا یک مدل داده شده به خوبی به داده های جدید تعمیم می یابد یا خیر. با این حال، استفاده از تنها دو پارتیشن ممکن است هنگام انجام دورهای زیادی از تنظیم هایپرپارامتر کافی نباشد.

اعتبار سنجی

نمودار گردش کار شامل سه مرحله است. 1. مدل قطار در مجموعه آموزشی. 2. ارزیابی مدل در مجموعه تست. 3. مدل را با توجه به نتایج در مجموعه تست بهینه سازی کنید. روی 1، 2 و 3 تکرار کنید، در نهایت مدلی را انتخاب کنید که بهترین عملکرد را در مجموعه آزمایشی دارد.
یک نوار افقی که به سه قسمت تقسیم شده است: 70٪ آن مجموعه آموزشی، 15٪ مجموعه اعتبار سنجی و 15٪ مجموعه تست است.
گردش کار مشابه شکل 1، با این تفاوت که گردش کار به جای ارزیابی مدل در برابر مجموعه تست، مدل را در برابر مجموعه اعتبارسنجی ارزیابی می کند. سپس، هنگامی که مجموعه آموزشی و مجموعه اعتبار سنجی کمابیش توافق کردند، مدل را در مقابل مجموعه آزمایشی تأیید کنید.