קל לארגן דפים בעזרת אוספים
אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.
למידה חישובית תהיה קלה מאוד אם כל עקומות ההפסדים שלנו ייראו כמו הפעם הראשונה שבה אימנו את המודל:
אבל למעשה, עקומות אובדן יכולות להיות מאתגרות מאוד. כדי להבין את השאלות הבאות, צריך להשתמש בתובנות לגבי עקומות אובדן נתונים.
1. המודל שלי לא יצליח!
החבר/ה שלך, מל, ואת/ה ממשיך/ת לעבוד על חיזוי חד-קרן.
זוהי עקומת ההפסדים הראשונה שלכם.
מתארים את הבעיה ואיך מאל יכול לתקן אותה:
לוחצים על סמל הפלוס כדי להרחיב את הקטע
ולגלות את התשובה.
המודל שלך לא מתמזג. כדאי לנסות את הפעולות הבאות לניפוי באגים:
כדי לבדוק אם התכונות יכולות לחזות את התוויות, בצעו את השלבים המפורטים בקטע
ניפוי באגים במודל.
תוכלו לבדוק את הנתונים מול סכימת נתונים כדי לזהות דוגמאות גרועות.
אם האימון נראה לא יציב, למשל במקום הזה, יש להקטין את
שיעור הלמידה כדי למנוע מהמודל לקפוץ במרחב
של הפרמטר.
צריך לפשט את מערך הנתונים עד 10 דוגמאות שידוע לך שהמודל יכול לחזות אותן. הפסד נמוך מאוד
במערך הנתונים המוקטן. לאחר מכן צריך להמשיך לנפות באגים במודל
במערך הנתונים המלא.
יש ליצור מודל פשוט יותר ולשפר את הביצועים של המודל. לאחר מכן יש להוסיף למודל את המורכבות.
2. האובדן שלי התפוצץ!
מל מציגה עקומה נוספת. מה השתבש כאן ואיך היא יכולה לתקן אותה?
יש לכתוב את התשובה למטה.
לוחצים על סמל הפלוס כדי להרחיב את הקטע ולגלות
את התשובה.
עלייה גדולה באובדן נגרמת בדרך כלל בגלל ערכים חריגים
בנתוני הקלט. סיבות אפשריות לכך הן:
Nan בנתוני הקלט.
ניפוח של שיפוע עקב נתונים חריגים.
חלוקה באפס.
לוגריתם של אפס או מספרים שליליים.
כדי לפצות על אובדן מתפוצץ, צריך לבדוק אם יש נתונים חריגים בקבוצות שלך,
וכן בנתונים ההנדסה. אם החריגה נראית בעייתית, יש לבדוק את הסיבה. אחרת, אם החריגה תיראה
כמו נתונים חריגים, חשוב לוודא שהחריגים
יחולקו באופן שווה בין הקבוצות על ידי השמעה אקראית של הנתונים.
3. המדדים שלי סותרים!
מל רוצה להשיג את העקומה שלך בעקומה אחרת. מה השתבש ואיך היא יכולה לתקן אותה? יש לכתוב את התשובה למטה.
מתארים את הבעיה ואיך מאל יכול לתקן אותה:
לוחצים על סמל הפלוס כדי להרחיב
את הקטע ולגלות את התשובה.
המדד 'זכירות' תקוע ב-0 כי ההסתברות לסיווג לדוגמה
אף פעם לא גבוהה מהסף
לסיווג חיובי. מצב זה מתרחש לעתים קרובות
בבעיות של
חוסר איזון בכיתה. חשוב לזכור שספריות למידת מכונה, כמו TF Keras, בדרך כלל משתמשות בסף ברירת המחדל 0.5 כדי לחשב מדדי סיווג.
אפשר לנסות את השלבים הבאים:
להוריד את סף הסיווג.
יש לבדוק מדדים של סף קבוע, כמו AUC.
4. הבדיקה נכשלה מאוד!
מל מציגה את עקומות ההפסדים במקרה של אימון ובדיקה של מערכי נתונים, ושואלת "מה הבעיה?" כדי לכתוב את התשובה בהמשך.
מתארים את הבעיה ואיך מאל יכול לתקן אותה:
לוחצים על סמל הפלוס כדי להרחיב את הקטע ולגלות
את התשובה.
המודל שלך חורג מנתוני האימון. פעולות שכדאי לנסות:
צמצום קיבולת הדגם.
הוספת סידור.
יש לוודא שהכשרות וחלוקתי הבדיקות
זהים מבחינה סטטיסטית.
5. הדגם שלי נתקע
אתם סבלים כאשר מל חוזר כמה ימים אחר כך עם עקומה נוספת. מה השתבש כאן ואיך אפשר לתקן את מל?
מתארים את הבעיה ואיך מאל יכול לתקן אותה:
לוחצים על סמל הפלוס כדי להרחיב את הקטע ולגלות את התשובה.
האובדן שלך מראה התנהגות שחוזרת על עצמה. ייתכן
שנתוני הקלט שהמודל שלך רואה מייצגים
התנהגות שחוזרת על עצמה. יש לוודא שהפעלה אקראית מסירה התנהגות חוזרת
מנתוני הקלט.
זה עובד!
"זה עובד עכשיו בצורה מושלמת!" מל מתקשר. היא נשענת על הכיסא וזוכה לרווחה. העקומה נראית מצוינת, והקרניים מגיעות עם הישג. מל ומקדישים רגע כדי לדון
בבדיקות הנוספות הבאות לצורך אימות המודל שלכם.