דף זה תורגם על ידי Cloud Translation API.

סדירה של פשטות: Lambda

מפתחי מודלים משפרים את ההשפעה הכוללת של מונח הרגולטור על ידי הכפלת הערך שלו בסקלרי שנקרא lambda (נקרא גם שיעור הרגולציה). כלומר, מפתחי מודלים נועדו לבצע את הפעולות הבאות:

$$\text{minimize(Loss(Data|Model)} + \lambda \text{ complexity(Model))}$$

לביצוע רגולזציה של L₂ יש את ההשפעה הבאה על מודל

מעודד את ערכי המשקל להיות 0 (אבל לא בדיוק 0)
מעודדת את הממוצע של המשקולות כלפי 0, עם התפלגות נורמלית (בצורת פעמון או גאוס).

הגדלת ערך lambda מחזקת את אפקט הרגולטור. לדוגמה, ההיסטוגרמה של המשקולות עבור ערך גבוה של למבדה עשויה להיראות כפי שמוצג באיור 2.

היסטוגרמה של משקלי המודל עם ממוצע אפס והתפלגות נורמלית.

איור 2. היסטוגרמה של המשקולות.

הפחתת הערך של למבדה נוטה להניב היסטוגרמה שטוחה, כפי שמוצג באיור 3.

היסטוגרמה של משקולות מודל עם ממוצע אפס שנמצא במקום כלשהו בין התפלגות שטוחה להתפלגות נורמלית.

איור 3. היסטוגרמה של משקולות שמיוצרות על ידי ערך למבדה נמוך יותר.

כשבוחרים ערך lambda, המטרה היא למצוא את האיזון הנכון בין פשטות להתאמה של נתוני אימון:

אם ערך lambda גבוה מדי, המודל יהיה פשוט, אבל קיים סיכון לצמצם את ההתאמה לנתונים. המודל שלכם לא ילמד מספיק על נתוני האימון כדי ליצור חיזויים שימושיים.
אם ערך ה-lambda נמוך מדי, המודל יהיה מורכב יותר, ויהיה סיכון של התאמת הנתונים לנתונים. המודל ילמד יותר מדי על המאפיינים הספציפיים של נתוני האימון, ולא יוכל להכליל אותו בנתונים חדשים.

הערך האידאלי של lambda יוצר מודל שמתייחס היטב לנתונים חדשים שלא נצפו בעבר. לצערנו, הערך האידיאלי של lambda הוא תלוי נתונים, ולכן תצטרכו לבצע כוונון כוונון.

לוחצים על סמל הפלוס כדי לקבל מידע על רמת הרגולציה וקצב הלמידה של L₂.

יש קשר הדוק בין קצב למידה לבין לומדים. ערכי רנדומליזציה חזקים של L₂ נוטים לגרום לשקלול של תכונות קרוב ל-0. קצבי למידה נמוכים יותר (עם עצירה מוקדמת) מייצרים בדרך כלל את אותה תוצאה, כי מספר הצעדים עד 0 לא גדול כל כך. כתוצאה מכך, שינוי של קצב הלמידה ושל המבדה בו-זמנית עלול להשפיע בצורה מדהימה.

עצירה מוקדמת פירושה סיום האימון לפני שהמודל מגיע לאיחוד מלא. בפועל, בהרבה מקרים עצירה מוקדמת מרומזת שלנו מתבטאת באימון אונליין (רציף). כלומר, חלק מהמגמות החדשות עדיין לא צברו מספיק נתונים כדי להתמזג.

כפי שצוין, ההשפעות של שינויים בפרמטרים של הרגולציה עלולות להתבלבל עם ההשפעות של השינויים בקצב הלמידה או של מספר החזרות. אחד מהתרגולים השימושיים (בזמן אימון על קבוצה קבועה של נתונים) הוא להקפיד על מספר גבוה מספיק של חזרות, כך שעצירה מוקדמת לא תעזור.

מרכז העזרה

תרחיש L2

פעילות במגרש משחקים: תרגילי L2

עצירה מוקדמת	למבדה
שיעור עמידה בתקנות

סדירה של פשטות: Lambda

לוחצים על סמל הפלוס כדי לקבל מידע על רמת הרגולציה וקצב הלמידה של L2.

לוחצים על סמל הפלוס כדי לקבל מידע על רמת הרגולציה וקצב הלמידה של L₂.