مجموعات التدريب ومجموعات الاختبار
نعود إلى Playground لتجربة
مجموعات التدريب ومجموعات الاختبار.
انقر على رمز علامة الجمع للتذكير بما تعنيه النقاط البرتقالية والزرقاء.
في التمثيل المرئي:
- تشير كل نقطة زرقاء إلى مثال واحد على فئة واحدة من البيانات (مثلاً، المحتوى غير المرغوب فيه).
- تشير كل نقطة برتقالية إلى مثال واحد على فئة أخرى من البيانات (على سبيل المثال،
ليست محتوى غير مرغوب فيه).
- ويمثّل لون الخلفية توقّع النموذج للمكان الذي يجب العثور فيه على أمثلة لذلك اللون. وتعني الخلفية الزرقاء حول النقطة الزرقاء أنّ النموذج يتوقّع بشكل صحيح هذا المثال. وفي المقابل،
تشير الخلفية البرتقالية حول النقطة الزرقاء إلى أنّ النموذج يقدّم
توقّعًا غير صحيح لهذا المثال.
يوفر هذا التمرين كلاً من مجموعة اختبار ومجموعة تدريب، كلاهما مأخوذ من
نفس مجموعة البيانات. بشكل افتراضي، لا يظهر التصور
سوى مجموعة التدريب. إذا كنت تريد أيضًا الاطّلاع على مجموعة الاختبار، انقر على مربّع الاختيار إظهار بيانات الاختبار أسفل العرض المرئي مباشرةً. في التصور، لاحظ الفرق التالي:
- أمثلة التدريب لها مخطط تفصيلي أبيض.
- تحتوي أمثلة الاختبار على مخطط أسود.
المهمة 1: شغِّل مساحة المرح بالإعدادات المحددة من خلال تنفيذ ما يلي:
- انقر على الزر تشغيل/إيقاف مؤقت:
- شاهد تغيير قيم الخسارة في الاختبار والخسارة في التدريب.
- عند توقُّف تغيير قيمة "الخسارة في الاختبار" و"خسارة التدريب" أو تغييرها مرة واحدة فقط من حين لآخر، اضغط على الزر "تشغيل/إيقاف مؤقت"
مجددًا لإيقاف "مساحة المرح".
لاحظ الفارق بين الخسارة في الاختبار وخسارة التدريب. سنحاول تقليل هذه الدلتا
في المهام التالية.
المهمة 2: قم بما يلي:
- اضغط على زر إعادة الضبط.
- عدِّل معدّل التعلّم.
- اضغط على الزر تشغيل/إيقاف مؤقت:
- اسمح لتطبيق Playground لمدة 150 حقبة على الأقل.
هل الدلتا بين الخسارة في الاختبار وخسارة التدريب أقل أو أعلى مع معدل التعلم الجديد هذا؟ ماذا يحدث في حال تعديل كل من
معدّل التعلّم
وحجم المجموعة؟
المهمة الاختيارية 3: يتيح لك شريط التمرير بعنوان النسبة المئوية لبيانات التدريب التحكم في نسبة بيانات التدريب إلى بيانات الاختبار. على سبيل المثال، عند الضبط على 90%، يتم استخدام 90% من البيانات لمجموعة التطبيق بينما يتم استخدام 10% المتبقية لمجموعة الاختبار.
فعليك إجراء ما يلي:
- قلِّل "النسبة المئوية لبيانات التدريب" من 50% إلى 10%.
- تجربة معدّل التعلّم وحجم المجموعة، ودوِّن الملاحظات حول النتائج التي توصّلت إليها.
هل يؤدي تغيير النسبة المئوية لبيانات التدريب إلى تغيير إعدادات
التعلم المثلى التي اكتشفتها في المهمة 2؟ إذا كان الجواب نعم، فلماذا؟
انقر فوق أيقونة الجمع للإجابة على المهمة 1.
عند ضبط معدل التعلم على 3 (الإعداد الأولي)،
يكون اختبار الخسارة أعلى بكثير من معدل فقدان التدريب.
انقر فوق أيقونة علامة الجمع للإجابة على المهمة 2.
من خلال خفض معدّل التعلّم (على سبيل المثال، إلى 0.001)،
يمكنك اختبار الانخفاض إلى قيمة أقرب بكثير من مقدار الخسارة في التدريب. في معظم العمليات، لا تؤثر زيادة حجم المجموعة
على خسارة التدريب أو خسارة الاختبار
بشكل كبير. ومع ذلك، في نسبة صغيرة من عمليات الجري، تؤدي زيادة
حجم المجموعة إلى 20 أو أكثر إلى انخفاض مستوى خسارة الاختبار قليلاً
أقل من خسارة التدريب.
يتم إنشاء مجموعات بيانات "مساحة المرح" بشكل عشوائي. وبالتالي، قد لا تتفق
إجاباتنا دائمًا مع إجاباتك.
انقر فوق أيقونة علامة الجمع للإجابة على المهمة 3.
يؤدي خفض النسبة المئوية لبيانات التدريب من 50٪ إلى 10٪ إلى تقليل عدد نقاط البيانات بشكل كبير في مجموعة التدريب. مع قلة البيانات، يؤدي الحجم الكبير ومعدّل التعلم العالي إلى جعل نموذج التدريب ينتقل بشكل غير منتظم (القفز مرارًا وتكرارًا فوق الحد الأدنى).