تعمیم

تعمیم به توانایی مدل شما برای انطباق مناسب با داده های جدید و قبلاً دیده نشده اشاره دارد که از همان توزیعی که برای ایجاد مدل استفاده شده است، استخراج شده است.

تعمیم

چرخه مدل، پیش بینی، نمونه، کشف توزیع واقعی، نمونه گیری بیشتر
  • هدف: به خوبی روی داده های جدید استخراج شده از توزیع واقعی (پنهان) پیش بینی کنید.
  • مشکل: ما حقیقت را نمی بینیم.
    • ما فقط از آن نمونه می گیریم.
چرخه مدل، پیش بینی، نمونه، کشف توزیع واقعی، نمونه گیری بیشتر
  • هدف: به خوبی روی داده های جدید استخراج شده از توزیع واقعی (پنهان) پیش بینی کنید.
  • مشکل: ما حقیقت را نمی بینیم.
    • ما فقط از آن نمونه می گیریم.
  • اگر مدل h به خوبی با نمونه فعلی ما مطابقت داشته باشد، چگونه می توانیم اعتماد کنیم که در سایر نمونه های جدید به خوبی پیش بینی می کند؟
  • از نظر تئوری:
    • زمینه جالب: نظریه تعمیم
    • بر اساس ایده های اندازه گیری سادگی / پیچیدگی مدل
  • شهود: رسمیت بخشیدن به اصل تیغ اوکام
    • هرچه یک مدل پیچیدگی کمتری داشته باشد، احتمال اینکه یک نتیجه تجربی خوب فقط به دلیل ویژگی‌های نمونه ما نباشد بیشتر است.
  • از نظر تجربی:
    • سوال: آیا مدل ما روی نمونه جدیدی از داده ها خوب عمل می کند؟
    • ارزیابی: نمونه جدیدی از داده ها را دریافت کنید - آن را مجموعه آزمایشی بنامید
    • عملکرد خوب در مجموعه تست به طور کلی یک شاخص مفید از عملکرد خوب در داده های جدید است:
      • اگر مجموعه تست به اندازه کافی بزرگ باشد
      • اگر با استفاده مکرر از مجموعه تست تقلب نکنیم

سه فرض اساسی در تمام موارد فوق:

  1. نمونه هایی را به طور مستقل و یکسان (iid) به طور تصادفی از توزیع ترسیم می کنیم
  2. توزیع ثابت است: در طول زمان تغییر نمی کند
  3. ما همیشه از توزیع یکسانی استفاده می کنیم: شامل آموزش، اعتبار سنجی و مجموعه های آزمایشی