פראצלום למידת מכונה: סיווג תמונה

מניעת התאמה יתר

כמו בכל מודל אחר של למידת מכונה, אחד החששות העיקריים במהלך אימון של רשת נוירונים מסובכת הוא התאמה: מודל שספציפי מאוד לפרטי האימון, עד שאי אפשר להכליל לדוגמאות חדשות. יש שתי שיטות למניעת הימצאות יתר של רשתות CNN:

  • שיפור נתונים: שיפור מלאכותי של הגיוון ומספר הדוגמאות לאימון על ידי ביצוע טרנספורמציות אקראיות לתמונות קיימות כדי ליצור קבוצה של וריאציות חדשות (ראו איור 7). הרחבת הנתונים שימושית במיוחד כשקבוצת נתוני האימון המקורית קטנה יחסית.
  • שימו לב להפסקה: הסרה אקראית של יחידות מהרשת הנוירולוגית במהלך שלב מעבר.

תרשים של הרחבת נתונים בתמונה אחת של כלבים, יצירת 9 תמונות חדשות דרך טרנספורמציות אקראיות איור 7. הגדלת נתונים על תמונה יחידה של כלב (מצולמת ממערך הנתונים "dogs לעומת Cats" זמינה ב-Kaggle). שמאלה: תמונת כלב מקורית מקבוצת האימון. ימין: תשע תמונות חדשות שנוצרו מהתמונה המקורית באמצעות טרנספורמציות אקראיות.