تشير العامية إلى قدرة النموذج على التكيف بشكل صحيح مع البيانات الجديدة التي لم يتم رؤيتها، والتي تم سحبها من التوزيع نفسه المستخدَم لإنشاء النموذج.
التعميم
الصورة الكبيرة
- الهدف: التنبؤ جيدًا بالبيانات الجديدة المأخوذة من التوزيع الحقيقي (المخفي) الفعلي.
- المشكلة: نحن لا نشاهد الحقيقة.
- يمكننا الحصول على عيّنة منها فقط.
الصورة الكبيرة
- الهدف: التنبؤ جيدًا بالبيانات الجديدة المأخوذة من التوزيع الحقيقي (المخفي) الفعلي.
- المشكلة: نحن لا نشاهد الحقيقة.
- يمكننا الحصول على عيّنة منها فقط.
- إذا كان النموذج h يناسب العيّنة الحالية بشكل جيد، كيف يمكننا الوثوق به في حال توقعه في عيّنات جديدة أخرى؟
كيف نعرف ما إذا كان نموذجنا جيدًا؟
- من الناحية النظرية:
- مجال مثير للاهتمام: نظرية التعميم
- استنادًا إلى أفكار قياس بساطة / تعقيد النموذج
- الحدس: مبادئ "أوكسام" من "أوكهام"
- وكلما كان النموذج أقل تعقيدًا، زاد احتمال أن تكون النتيجة التجريبية الجيدة ليست بسبب ميزات العينة فقط
كيف نعرف ما إذا كان نموذجنا جيدًا؟
- عمليًا:
- السؤال: هل سيكون نموذجنا جيدًا في عيّنة جديدة من البيانات؟
- التقييم: احصل على عيّنة جديدة من البيانات
- يُعد الأداء الجيد في مجموعة الاختبار مؤشرًا مفيدًا على الأداء الجيد للبيانات الجديدة بشكل عام:
- إذا كانت مجموعة الاختبارات كبيرة بما يكفي
- إذا لم نمارس الغش باستخدام تمارين الاختبار مرارًا وتكرارًا
النص الدقيق في تعلّم الآلة
ثلاثة افتراضات أساسية في كل ما سبق:
- نرسم أمثلة بشكل مستقل ومتماثل (أي) عشوائيًا من التوزيع
- التوزيع ثابت: لا يتغيّر بمرور الوقت
- نستخدم دائمًا التوزيع نفسه: بما في ذلك مجموعات التدريب والتحقّق من الصحة والاختبار.