عملية تعلُّم الآلة: تصنيف الصور

منع الاحتواء الزائد

كما هو الحال مع أي نموذج لتعلُّم الآلة، هناك قلق كبير عند التدريب على الشبكة العصبونية التشويهية، وهو أنّه نموذج يتماشى مع تفاصيل بيانات التدريب بحيث يتعذّر تعميمها على أمثلة جديدة. هناك أسلوبان لمنع الإجهاد الزائد عند إنشاء CNN:

  • زيادة البيانات: تعزيز التنوع وعدد أمثلة التدريب بشكل مصطنع من خلال إجراء تغييرات عشوائية على الصور الحالية لإنشاء مجموعة من الخيارات الجديدة (اطّلِع على الشكل 7). تُعدّ زيادة البيانات مفيدة بشكل خاص عندما تكون مجموعة بيانات التدريب الأصلية صغيرة نسبيًا.
  • تنظيم الإسقاط: إزالة الوحدات عشوائيًا من الشبكة العصبونية أثناء اتّباع خطوة التدرج في التدريب.

مخطّط لزيادة البيانات على صورة كلب واحد لإنتاج 9 صور جديدة من خلال عمليات تحويل عشوائية الشكل 7. تجميع البيانات على صورة كلب واحد (تم استخراجها من "الكلاب، والقطط&quot، ومجموعة البيانات المتوفّرة على Kaggle) يسار: صورة كلب أصلية من مجموعة التدريب. على اليمين: تسع صور جديدة يتم إنشاؤها من صورة أصلية باستخدام عمليات تحويل عشوائية.