קל לארגן דפים בעזרת אוספים
אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.
חדש: קרוסלות תכונות
האם חוצה מאפיינים יכולים להפעיל מודל כדי להתאים לנתונים לא לינאריים?
כדי לברר זאת, נסו לבצע את הפעילות הגופנית הזו.
משימה: נסו ליצור מודל שמפריד בין הנקודות הכחולות מהנקודות הכתומות על ידי שינוי ידני של המשקלים של שלוש תכונות הקלט הבאות:
x1
x2
x1x2 (צלב תכונות)
כדי לשנות משקל באופן ידני:
יש ללחוץ על קו שמקשר בין 'תכונות' ל'יציאה'.
יופיע טופס קלט.
מקלידים ערך של נקודה צפה (floating-point) בטופס הקלט הזה.
לוחצים על Enter.
חשוב לציין שממשק התרגיל הזה לא מכיל לחצן שלב.
כי תרגיל זה לא מלמד מודל באופן קבוע.
במקום זאת, תצטרכו להזין באופן ידני את המשקלים "&final;
(התשובות מופיעות מתחת לפעילות הגופנית).
לוחצים על סמל הפלוס בתשובה.
w1 = 0
w2 = 0
x1x2 = 1 (או כל ערך חיובי)
אם תזינו ערך שלילי בצלע התכונות, המודל יפריד בין הנקודות הכחולות מהנקודות הכתומות, אבל החיזויים יהיו שגויים לחלוטין.
כלומר, המודל יחזה כתום עבור הנקודות הכחולות, וכחול עבור הנקודות הכתומות.
קשתות על תכונות מורכבות יותר
עכשיו נשחק עם כמה שילובים מתקדמים של תכונות שונות.
הנתונים במשחק הזה במגרש המשחקים נראים קצת רועשים ממשחק של קליעה למטרה, כשהנקודות הכחולות באמצע באמצע, והנקודות הכתומות בטבעת חיצונית.
לחיצה על סמל הפלוס תציג הסבר על התצוגה החזותית של המודל.
כל תרגיל Playground מציג המחשה של מצב המודל הנוכחי. לדוגמה, הנה תצוגה חזותית:
חשוב לשים לב לנקודות הבאות לגבי התצוגה החזותית של המודל:
כל ציר מייצג תכונה ספציפית. במקרה של ספאם לעומת לא ספאם,
התכונות יכולות להיות מספר המילים ומספר הנמענים של
האימייל.
כל נקודה מכילה את ערכי התכונות עבור דוגמה אחת של הנתונים, למשל
באימייל.
צבע הנקודה מייצג את המחלקה שאליה שייכת הדוגמה.
לדוגמה, הנקודות הכחולות יכולות לייצג הודעות אימייל שאינן ספאם, והנקודות הכתומות יכולות לייצג הודעות ספאם.
צבע הרקע מייצג את החיזוי של המודל שבו צריך למצוא דוגמאות לצבע הזה. רקע כחול מסביב לנקודה כחולה
פירושו שהמודל חוזה את הדוגמה הנכונה. לעומת זאת,
רקע כתום מסביב לנקודה כחולה פירושו שהמודל
חוזה בצורה שגויה את הדוגמה הזו.
צבעי הבלוז והכתום של הרקע מותאמים. לדוגמה, הצד השמאלי של התצוגה החזותית צבוע בכחול, אבל הופך לשקוף בהדרגה
ללבן במרכז
של התצוגה החזותית. אפשר לחשוב על חוזק הצבע כהצעה
של ביטחון המודל בניחוש שלו. המשמעות של כחול בהיר היא שהמודל
בטוח מאוד בניחושים שלו והכחול בהיר
פירושו שהמודל
פחות בטוח. (המחשה של המודל המוצגת באיור עושה
עבודה גרועה של חיזוי.)
היעזרו בתצוגה החזותית כדי לבחון את התקדמות המודל שלכם.
("מצוין – לרוב הנקודות הכחולות יש רקע כחול" או
"אוי לא! הנקודות הכחולות הן על רקע כתום."
מעבר לצבעים, אפליקציית Playground
מציגה גם את ההפסד הנוכחי של המודל.
("אוי לא! אובדן עולה במקום למטה.")
משימה 1: מתוך המודל הלינארי הזה. הקדישו דקה או שתיים (אבל לא יותר) כדי לנסות הגדרות שונות של שיעור למידה כדי לראות אם יש שיפורים. האם מודל לינארי יכול להניב תוצאות יעילות עבור קבוצת הנתונים הזו?
משימה 2: נסו להוסיף תכונות במוצרים שונים, כמו
x1x2, כדי לנסות לבצע אופטימיזציה של הביצועים.
אילו תכונות הכי מועילות?
מהי הביצועים הטובים ביותר שאפשר להשיג?
משימה 3: כאשר יש מודל טוב, בדקו את פני השטח של פלט המודל (מוצג על ידי צבע הרקע).
האם הוא נראה כמו מודל לינארי?
איזה תיאור מתאים לדעתך למודל?
(התשובות מופיעות מתחת לפעילות הגופנית).
אפשר ללחוץ על סמל הפלוס עבור התשובה למשימה 1.
לא. מודל לינארי לא יכול ליצור מודל יעיל של קבוצת הנתונים הזו. צמצום
שיעור הלמידה מפחית את אובדן הנתונים, אבל שיעור ההפסדים עדיין גבוה מאוד.
אפשר ללחוץ על סמל הפלוס כדי לענות למשימה 2.
קבוצות הנתונים של Playground נוצרות באופן אקראי. לכן, ייתכן שהתשובות שלנו לא תמיד יהיו תואמות לחלוטין לתשובות שלכם. למעשה, אם תיצרו מחדש את קבוצת הנתונים בין ההפעלות, התוצאות שלכם לא תמיד יסכימו בדיוק עם הריצות הקודמות שלכם. כלומר, תקבלו תוצאות טובות יותר אם תבצעו את הפעולות הבאות:
שימוש ב-x12 וב-x22 כחוצה תכונות. (הוספת x1x2 כצלב תכונות לא נראית כמו עזרה.)
הורדה של שיעור הלמידה, אולי ל-0.001.
אפשר ללחוץ על סמל הפלוס כדי לענות למשימה 3.
משטח הפלט של המודל לא נראה כמו מודל לינארי. למעשה, זה נראה אליפטי.