רשת נוירונים ראשונה

בתרגיל הזה נאמן את רשת הנוירונים הקטנה הראשונה שלנו. רשתות נוירונים יאפשרו לנו ללמוד מודלים לא ליניאריים שימוש בהצלבות תכונות מפורשות.

משימה 1: המודל כפי שניתן כאן משלב את שתי תכונות הקלט של נוירון יחיד. האם המודל הזה ילמד אי-ליניאריות? צריך להפעיל אותו כדי לאשר הוא ניחוש.

משימה 2: נסו להגדיל את מספר נוירונים בשכבה הסמויה 1 עד 2, וגם לנסות לשנות מהפעלה לינארית להפעלה לא ליניארית כמו ReLU. אתם יכולים ליצור מודל שיכול ללמוד על לא ליניאריות? האם ניתן לבנות מודלים את הנתונים בצורה יעילה?

משימה 3: נסו להגדיל את מספר נוירונים בשכבה הנסתרת 2 עד 3, באמצעות הפעלה לא ליניארית כמו ReLU. האם היא יכולה ליצור מודל של הנתונים יעילה? איך איכות המודל משתנה מהרצה להרצה?

משימה 4: המשיכו בניסוי על ידי הוספה או הסרה של שכבות מוסתרות ונוירונים לכל שכבה. אתם גם מוזמנים לשנות את קצב הלמידה, הרגולריזציה והגדרות למידה אחרות. מה הכי קטן את מספר הנוירונים והשכבות שבהם אפשר להשתמש, שגורמים לאובדן הבדיקה של 0.177 ומטה?

האם הגדלה של גודל המודל משפרת את ההתאמה, או באיזו מהירות הוא מתכנס? האם זה משנה את התדירות שבה הוא מתכנס למודל טוב? לדוגמה, כדאי לנסות את את הארכיטקטורה הבאה:

  • השכבה הסמויה הראשונה עם שלושה נוירונים.
  • שכבה שנייה מוסתרת עם 3 נוירונים.
  • שכבה שלישית מוסתרת עם שני נוירונים.

(התשובות מופיעות מתחת לתרגיל).