التعميم

تشير العامية إلى قدرة النموذج على التكيف بشكل صحيح مع البيانات الجديدة التي لم يتم رؤيتها، والتي تم سحبها من التوزيع نفسه المستخدَم لإنشاء النموذج.

التعميم

دورة النموذج، التوقع، عيّنة، اكتشاف التوزيع الحقيقي، مزيد من العينات
  • الهدف: التنبؤ جيدًا بالبيانات الجديدة المأخوذة من التوزيع الحقيقي (المخفي) الفعلي.
  • المشكلة: نحن لا نشاهد الحقيقة.
    • يمكننا الحصول على عيّنة منها فقط.
دورة النموذج، التوقع، عيّنة، اكتشاف التوزيع الحقيقي، مزيد من العينات
  • الهدف: التنبؤ جيدًا بالبيانات الجديدة المأخوذة من التوزيع الحقيقي (المخفي) الفعلي.
  • المشكلة: نحن لا نشاهد الحقيقة.
    • يمكننا الحصول على عيّنة منها فقط.
  • إذا كان النموذج h يناسب العيّنة الحالية بشكل جيد، كيف يمكننا الوثوق به في حال توقعه في عيّنات جديدة أخرى؟
  • من الناحية النظرية:
    • مجال مثير للاهتمام: نظرية التعميم
    • استنادًا إلى أفكار قياس بساطة / تعقيد النموذج
  • الحدس: مبادئ "أوكسام" من "أوكهام"
    • وكلما كان النموذج أقل تعقيدًا، زاد احتمال أن تكون النتيجة التجريبية الجيدة ليست بسبب ميزات العينة فقط
  • عمليًا:
    • السؤال: هل سيكون نموذجنا جيدًا في عيّنة جديدة من البيانات؟
    • التقييم: احصل على عيّنة جديدة من البيانات
    • يُعد الأداء الجيد في مجموعة الاختبار مؤشرًا مفيدًا على الأداء الجيد للبيانات الجديدة بشكل عام:
      • إذا كانت مجموعة الاختبارات كبيرة بما يكفي
      • إذا لم نمارس الغش باستخدام تمارين الاختبار مرارًا وتكرارًا

ثلاثة افتراضات أساسية في كل ما سبق:

  1. نرسم أمثلة بشكل مستقل ومتماثل (أي) عشوائيًا من التوزيع
  2. التوزيع ثابت: لا يتغيّر بمرور الوقت
  3. نستخدم دائمًا التوزيع نفسه: بما في ذلك مجموعات التدريب والتحقّق من الصحة والاختبار.