التحقّق من مدى فهمك: تصحيح الأخطاء في النماذج

بالنسبة إلى الأسئلة التالية، انقر على اختيارك لتوسيعه والاطّلاع على إجابتك.

نهج وضع النماذج

أنت وصديقك ميل مثل قرن وحيد القرن. في الواقع، أنت تحب وحيد القرن كثيرًا، وتقرر توقع ظهور القرن وحيدًا باستخدام ... التعلم الآلي. لديك مجموعة بيانات مكوّنة من 10000 مظهر قرن واحد. في كل شكل، تحتوي مجموعة البيانات على الموقع والوقت من اليوم والارتفاع ودرجة الحرارة والرطوبة والكثافة السكانية وغطاء الشجر وقوس قزح والعديد من الميزات الأخرى.

تريد البدء في تطوير نموذج تعلُّم الآلة. أي مما يلي يشكّل طريقة جيدة لبدء عملية التطوير؟
وتبدو غالبًا قرن وحيد القرن عند الفجر والغسق. لذلك، استخدِم الميزة "الوقت من اليوم" لإنشاء نموذج خطي.
إجابتك صحيحة. ويُعدّ النموذج الخطي الذي يستخدم ميزة أو ميزتَين قائمتَين على التوقّعات إلى حد كبير طريقة فعّالة للبدء.
يُعدّ توقّع شكل ظهور وحيد القرن أمرًا صعبًا للغاية. وبالتالي، ننصحك باستخدام شبكة عصبية عميقة تتضمّن كل الميزات المتاحة.
إجابتك غير صحيحة. سيؤدي البدء بنموذج معقّد إلى تعقيد عملية تصحيح الأخطاء.
ابدأ بنموذج خطي بسيط، ولكن استخدِم جميع الميزات لضمان حصول النموذج البسيط على قدرة على التوقّع.
إجابتك غير صحيحة. إذا كنت تستخدم العديد من الميزات، حتى باستخدام نموذج خطي، يصبح النموذج الناتج معقّدًا ويصعب تصحيح أخطائه.

المرجع

باستخدام توقّعات التراجع مع فقد الخطأ المربّع (MSE)، يتم توقّع تكلفة رحلة سيارة الأجرة باستخدام مدة الرحلة ومسافتها ومنشأها ونهايتها. أنت تعلم:

  • متوسّط تكلفة الرحلة 15 دولارًا أمريكيًا (أو ما يعادلها بالعملة المحلية).
  • تزداد تكلفة الرحلة بمبلغ ثابت لكل كيلومتر.
  • ويتم تحصيل رسوم إضافية مقابل الرحلات في وسط المدينة.
  • تبدأ الرحلات بحد أدنى تكلفة قدرها 3 دولارات.

حدِّد ما إذا كانت المراجع الأساسية التالية مفيدة.

هل هذا أساس مفيد: تبلغ تكلفة كل رحلة 15 دولارًا أمريكيًا (أو ما يعادلها بالعملة المحلية).
نعم
إجابتك صحيحة. التكلفة المتوسطة هي مرجع مفيد.
لا
إجابتك غير صحيحة. يؤدي دائمًا إلى توقّع المتوسط في قيمة أدنى لمحرّك البحث (MSE) مقارنةً بتوقّع أي قيمة أخرى دائمًا. وبالتالي، يؤدي اختبار نموذج على هذا الأساس إلى تقديم مقارنة مفيدة.
يعتمد ذلك على الانحراف العادي لتكلفة الرحلة.
إجابتك غير صحيحة. وبغض النظر عن الانحراف العادي، تُعدّ متوسط تكلفة الرحلة مرجعًا مفيدًا لأنّ دائمًا ما يتم توقّع متوسط متوسط عدد مرات الظهور (MSE) مقارنةً بتوقّع أي قيمة أخرى دائمًا.
هل هذا مرجع مفيد: نموذج مدرّب يستخدم فقط المدة والأصل كميزات.
نعم
إجابتك غير صحيحة. يجب استخدام نموذج مدرّب فقط بعد أن يتم التحقّق من صحة النموذج بشكل كامل في مرحلة الإنتاج. وعلاوةً على ذلك، يجب التحقّق من صحة النموذج المدرّب وفقًا لمبدأ أساسي أكثر بساطة.
لا
إجابتك صحيحة. يجب استخدام نموذج مدرّب فقط بعد أن يتم التحقّق من صحة النموذج بشكل كامل في مرحلة الإنتاج.
هل هذه الإرشادات مفيدة: تكلفة الرحلة هي مسافة الرحلة (بالكيلومتر) مضروبة في السعر لكل كيلومتر.
نعم
إجابتك صحيحة. والمسافة هي العامل الأكثر أهمية في تحديد تكلفة الرحلة. لذلك، من المفيد استخدام عنوان أساسي يعتمد على المسافة.
لا
إجابتك غير صحيحة. تُعدّ المسافة هي العامل الأكثر أهمية في تحديد تكلفة الرحلة. لذلك، من المفيد استخدام عنوان أساسي يعتمد على المسافة.
هل هذا مرجع مفيد: تبلغ تكلفة كل رحلة 1 دولار أمريكي (أو ما يعادلها بالعملة المحلية). لأنه يجب أن يكون النموذج دائمًا على أساس هذه القاعدة وفي حال عدم مخالفة النموذج هذه القاعدة، يمكننا التأكّد من أنّ النموذج يتضمّن خطأ.
نعم
إجابتك غير صحيحة. ولا يشكّل هذا الإجراء مرجعًا مفيدًا، لأنه غير صحيح دائمًا. ولا يُعدّ مقارنة النموذج بمعيار غير صحيح دائمًا مفيدًا.
لا
إجابتك صحيحة. هذا المرجع ليس اختبارًا مفيدًا لنموذجك.

المعلمات الزائدة

توضّح الأسئلة التالية المشاكل المتعلقة بتدريب أداة تصنيف. اختَر الإجراءات التي يمكن أن تؤدي إلى حل المشكلة الموضَّحة.

فقدان التدريب 0.24 وفقدان التحقق هو 0.36. أي من الإجراءَين التاليَين يمكن أن يقلل من الفرق بين التدريب وفقدان التحقق؟
تأكّد من أن مجموعات التدريب والتحقّق من الملكية تحتوي على الخصائص الإحصائية نفسها.
إجابتك صحيحة. إذا كانت مجموعات التدريب والتحقُّق تحتوي على خصائص إحصائية مختلفة، لن تساعد بيانات التدريب في توقع بيانات التحقق.
استخدِم التسوية لمنع الاحتواء الزائد.
إجابتك صحيحة. إذا كانت خسارة التدريب أقل من فقدان التحقق من الصحة، من المحتمل أن يكون نموذجك غير مناسب لبيانات التدريب. تمنع عملية الإضافة الزائدة
زِد عدد فترات التدريب.
إجابتك غير صحيحة. إذا كانت خسارة التدريب أقل من فقدان التحقق من الصحة، يكون نموذجك عادةً أكثر ملاءمة لبيانات التدريب. ستؤدي زيادة حلقات التدريب إلى زيادة الاحتواء.
خفض معدل التعلّم
إجابتك غير صحيحة. عادةً ما تشير الخسارة الناتجة عن التحقّق من الصحة إلى أكبر من خسارة التدريب. ولا يؤدي تغيير معدّل التعلّم إلى الحدّ من المبالغة.
يمكنك تنفيذ الإجراءات الصحيحة الموضّحة في السؤال السابق، وانخفاضًا في الخسائر التدريبية والتحقّق من صحّة المعلومات من 1.0 إلى 0.24 تقريبًا بعد التدريب للفترات الطويلة. ما هو الإجراء الذي يمكن أن يساعد في الحدّ من خسارة التدريبات؟
عزِّز عمق الشبكة العصبونية وعرضها.
إجابتك صحيحة. إذا ظلت وتيرة التدريب ثابتة عند 0.24 بعد التدريب على العديد من الفترات، قد يفتقر نموذجك إلى القدرة التنبؤية على تقليل الخسارة. ويمكن أن تؤدي زيادة عمق النموذج وعرضه إلى منح النموذج القدرة الإضافية على التوقّع المطلوبة لتقليل خسارة التدريب.
زِد عدد فترات التدريب.
إجابتك غير صحيحة. إذا بقيت خسارة التدريب عند 0.24 بعد التدريب على العديد من الفترات، قد لا يؤدي مواصلة تدريب النموذج إلى انخفاض كبير في خسارة التدريب.
زيادة معدّل التعلّم
إجابتك غير صحيحة. يُرجى العِلم بأنّ زيادة معدّل التعلّم لم تقلّل العديد من فترات التدريب، ومن المحتمل ألا يؤدي رفع معدّل التعلّم إلى تقليل نسبة التدريب النهائي. بدلاً من ذلك، قد تؤدي زيادة معدل التعلّم إلى جعل تدريبك غير مستقر ومنع نموذجك من تعلُّم البيانات.
اتخذت الإجراء الصحيح في السؤال السابق. انخفضت وتيرة تدريب النموذج إلى 0.20. لنفترض أنّك بحاجة إلى تقليل خسارة التدريب على النموذج قليلاً. ويمكنك إضافة بعض الميزات التي يبدو أنها تتطلّب استخدام القدرة على التوقّع. ومع ذلك، تستمر نسبة فقدان التدريب في التقلّب. أي من الخيارات التالية يمكن أن يساهم في الحدّ من خسارة تدريبك؟
ارفع عمق الطبقات وعرضها.
إجابتك صحيحة. قد يفتقر نموذجك إلى القدرة على تعلّم الإشارات التنبؤية في الميزات الجديدة.
زِد فترات التدريب.
إجابتك غير صحيحة. وإذا كان تقلّب تدريب النموذج يتقلّب من 0.20 عامًا، من المحتمل أن يؤدي زيادة عدد فترات التدريب إلى حدوث تقلّب في فقدان التدريب على النموذج حوالي 0.20.
لا تضيف الميزات معلومات ذات صلة بالميزات الحالية. جرِّب ميزة مختلفة.
إجابتك صحيحة. ومن الممكن أن تكون الإشارات التنبؤية التي تم تشفيرها بواسطة الميزات موجودة من قبل في الميزات التي تستخدمها.
خفض معدل التعلّم
إجابتك صحيحة. ومن الممكن أن تكون إضافة الميزات الجديدة قد جعلت المشكلة أكثر تعقيدًا. على وجه التحديد، يشير التقلبات في الخسارة إلى أن معدّل التعلّم مرتفع جدًا وأن نموذجك يقفز حول الحد الأدنى. وسيؤدي خفض معدّل التعلّم إلى مساعدة النموذج في تعلُّم الحد الأدنى.