تنظيم صفحاتك في مجموعات
يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.
مجموعات التدريب ومجموعات الاختبار
نعود إلى Playground لتجربة مجموعات التدريب
ومجموعات الاختبار.
انقر على رمز الإضافة لتذكيرك بما تعنيه النقاط البرتقالية والزرقاء.
في التصور:
تشير كل نقطة زرقاء إلى مثال واحد لفئة واحدة من البيانات (على سبيل المثال،
محتوى غير مرغوب فيه).
تشير كل نقطة برتقالية إلى مثال واحد لفئة أخرى من البيانات (على سبيل المثال،
مثلاً، ليست محتوى غير مرغوب فيه).
يمثل لون الخلفية تنبؤ النموذج بالمكان الذي تظهر فيه الأمثلة
من هذا اللون. خلفية زرقاء حول نقطة زرقاء
أن النموذج يتنبأ بهذا المثال بشكل صحيح. وعلى العكس،
وجود خلفية برتقالية حول نقطة زرقاء يعني أن النموذج يصنع
تنبؤًا غير صحيح لهذا المثال.
يوفر هذا التمرين مجموعة اختبار ومجموعة تدريب، وكلاهما مأخوذ من
نفس مجموعة البيانات. بشكل تلقائي، يُظهر التمثيل المرئي التدريب فقط
تعيين. إذا كنت تريد أيضًا عرض مجموعة الاختبار، فانقر على
مربّع الاختيار عرض بيانات الاختبار أسفل التمثيل البصري مباشرةً. في جلسة المعمل،
مؤثرات عرض البيانات، لاحظ الاختلاف التالي:
أمثلة التدريب لها مخطط أبيض.
أمثلة الاختبار لها مخطط أسود.
المهمة 1: تشغيل "مساحة المرح" بالإعدادات المحدّدة من خلال تنفيذ
التالي:
انقر على الزر "تشغيل/إيقاف مؤقت":
شاهد تغيُّر قيم الخسارة في الاختبار ومعدّل الخسارة في التدريب.
عند توقُّف تغيير قيمتَي "الخسارة في الاختبار" و"فقدان التدريب"
أو تغييرها مرة واحدة فقط كل فترة، اضغط على الزر "تشغيل/إيقاف مؤقت"
مرة أخرى لإيقاف Playground مؤقتًا.
لاحظ الفارق بين خسارة الاختبار وفقدان التدريب. سنحاول تقليل هذا
دلتا في المهام التالية.
اسمح بتشغيل "مساحة المرح" لمدة 150 حقبة على الأقل.
هل الفارق بين خسارة الاختبار وخسارة التدريب أقل أم
أعلى مع معدل التعلم الجديد هذا؟ ماذا يحدث في حال تعديل كِلا النوعين
معدل التعلم
حجم الدفعة؟
المهمة الاختيارية 3: شريط تمرير يحمل اسم النسبة المئوية لبيانات التدريب
التحكم في نسبة بيانات التطبيق لاختبار البيانات. على سبيل المثال:
عند الضبط على 90%، يتم استخدام 90% من البيانات في مجموعة التطبيق
يتم استخدام 10٪ المتبقية لمجموعة الاختبار.
فعليك إجراء ما يلي:
خفض "النسبة المئوية لبيانات التدريب" من 50% إلى 10%.
جرب باستخدام معدل التعلم وحجم المجموعة وتدوين الملاحظات على
نتائجك.
هل تغيير النسبة المئوية لبيانات التدريب يؤدي إلى تغيير المستوى الأمثل
إعدادات التعلم التي اكتشفتها في المهمة 2؟ إذا كان الجواب نعم، فلماذا؟
انقر فوق أيقونة الجمع للإجابة على المهمة 1.
عند ضبط معدل التعلّم على 3 (الإعداد الأولي)،
يكون معدّل فقدان الاختبار أعلى بكثير من معدّل فقدان التدريب.
انقر فوق أيقونة الجمع للإجابة على المهمة 2.
من خلال خفض معدّل التعلّم (على سبيل المثال، إلى 0.001):
انخفض الاختبار إلى قيمة أقرب بكثير إلى خسارة التدريب. في معظم الفترات،
لا تؤثر زيادة حجم المجموعة على فقدان التدريب أو الاختبار
بشكل كبير. ومع ذلك، في نسبة صغيرة من عمليات الجري، فإن زيادة
يؤدي حجم المجموعة إلى 20 أو أكثر إلى حدوث انخفاض طفيف في عدد الاختبار.
أقل من معدل فقدان التدريب.
يتم إنشاء مجموعات بيانات "مساحة المرح" بشكل عشوائي. وبالتالي،
قد لا تتوافق الإجابات دائمًا تمامًا مع إجاباتك.
انقر فوق أيقونة الجمع للإجابة على المهمة 3.
تقليل نسبة بيانات التدريب من 50٪ إلى 10٪ بشكل كبير
إلى تقليل عدد نقاط البيانات في مجموعة التطبيق. مع القليل جدًا من البيانات،
أن يكون حجم المجموعة الكبير ومعدل التعلم المرتفع يؤدي إلى قفزة نموذج التدريب
بشكل فوضوي (قفز بشكل متكرر عبر الحد الأدنى).
تاريخ التعديل الأخير: 2024-08-22 (حسب التوقيت العالمي المتفَّق عليه)
[[["يسهُل فهم المحتوى.","easyToUnderstand","thumb-up"],["ساعَدني المحتوى في حلّ مشكلتي.","solvedMyProblem","thumb-up"],["غير ذلك","otherUp","thumb-up"]],[["لا يحتوي على المعلومات التي أحتاج إليها.","missingTheInformationINeed","thumb-down"],["الخطوات معقدة للغاية / كثيرة جدًا.","tooComplicatedTooManySteps","thumb-down"],["المحتوى قديم.","outOfDate","thumb-down"],["ثمة مشكلة في الترجمة.","translationIssue","thumb-down"],["مشكلة في العيّنات / التعليمات البرمجية","samplesCodeIssue","thumb-down"],["غير ذلك","otherDown","thumb-down"]],["تاريخ التعديل الأخير: 2024-08-22 (حسب التوقيت العالمي المتفَّق عليه)"],[],[]]