נתונים קטגוריים: תרגולים שונים של תכונות

Playground היא אפליקציה אינטראקטיבית שמאפשרת לשנות היבטים שונים של אימון ובדיקה של מודל למידת מכונה. ב-Playground אפשר לבחור תכונות ולשנות היפר-פרמטרים, ולגלות איך הבחירות שלכם משפיעות על המודל.

הדף הזה מכיל שני תרגילים ב-Playground.

תרגיל 1: הצלבת תכונות בסיסיות

בתרגיל הזה, נתמקד בחלקים הבאים בממשק המשתמש של Playground:

  • מתחת לתכונות, שימו לב לשלוש תכונות אפשריות של המודל:
    • x1
    • x2
    • x1x2
  • מתחת לפלט יופיע ריבוע שמכיל כתום והנקודות הכחולות. נניח שאתם מסתכלים על יער מרובע, שבו נקודות כתומות מציינות את המיקום של עצים חולים ונקודות כחולות מציינות של עצים בריאים.
  • בין FEATURES ל-OUTPUT, אם תסתכלו מקרוב, תראו קווים חלשים מקווקווים שמחברים כל מאפיין לפלט. הרוחב של כל קו מקווקו מסמל את המשקל שמשויך כרגע לגבי כל תכונה. השורות האלה חלשים מאוד מפני שמשקל ההתחלה עבור כל מאפיין, המערכת מאתחלת את הערך 0. ככל שהמשקל יגדל או יקטן, כך יתחזק או יתחלש העובי של הקווים האלה.

משימה 1: בודקים את Playground באופן הבא:

  1. לוחצים על הקו הדק שמחבר את המאפיין x1 לפלט. יופיע חלון קופץ.
  2. בחלון הקופץ, מזינים את המשקל 1.0.
  3. מקישים על Enter.

חשוב לשים לב לפרטים הבאים:

  • הקו המקווקו של x1 נעשה עבה יותר ככל שהמשקל גדל מ-0 ל-1.0.
  • יופיע רקע כתום וכחול.
    • הרקע הכתום הוא הניחושים של המודל בנוגע למיקום העצים החולים הן.
    • הרקע הכחול הוא הניחוש של המודל לגבי המיקום של העצים הבריאים הן. המודל עושה עבודה גרועה, כמחצית מהניחושים של המודל שגוי.
  • מאחר שהמשקל הוא 1.0 עבור x1 ו-0 עבור המאפיינים האחרים, המודל תואם בדיוק לערכים של x1.

משימה 2: שנו את המשקולות של כל אחת משלושת הישויות האלה, כך (צבעי הרקע) יחזה בהצלחה עצים. הפתרון מופיע ממש מתחת ל-Playground.



תרגול 2: שילוב תכונות מתקדם יותר

בתרגיל השני, בדקו את סידור הנקודות הכתומות (עצים חולים) ונקודות כחולות (עצים בריאים) במודל הפלט, תוך התייחסות לדברים הבאים:

  • הנקודות יוצרות דפוסים כדוריים.
  • הסדר של הנקודות רועש. לדוגמה, שימו לב לכחול נקודות בכדור החיצוני של הנקודות הכתומות. כתוצאה מכך, גם מודל מצוין לא צפוי לחזות בצורה מדויקת כל נקודה.

משימה 1: מבצעים את הפעולות הבאות כדי לחקור את ממשק המשתמש של Playground:

  1. ללחוץ על הלחצן 'הפעלה/השהיה', שהוא משולש לבן בתוך משולש שחור מעגל. Playground יתחיל לאמן את המודל. תוכלו לראות את המספר של Epochs עולה.
  2. אחרי שהמערכת תאמן במשך 300 מחזורים לפחות, לוחצים על אותו לחצן הפעלה/השהיה כדי להשהות את האימון.
  3. תראו את המודל. האם המודל מספק תחזיות טובות? במילים אחרות, האם הנקודות הכחולות מוקפות בדרך כלל ברקע כחול, והנקודות הכתומים מוקפות בדרך כלל ברקע כתום?
  4. בודקים את הערך של 'אובדן בבדיקה' שמופיע מתחת ל'פלט'. האם הערך קרוב יותר ל-1.0 (אובדן גבוה יותר) או ל-0 (אובדן נמוך יותר)?
  5. מאפסים את Playground על ידי לחיצה על החץ העקומה שמשמאל לחצן הפעלה/השהיה.

משימה 2: מבצעים את הפעולות הבאות כדי לבנות מודל טוב יותר:

  1. בוחרים או מבטלים את הבחירה בכל שילוב של חמש התכונות האפשריות.
  2. מתאימים את קצב הלמידה.
  3. אימון המערכת למשך 500 תקופות של זמן לפחות.
  4. בודקים את הערך של Test loss. האם יכול להיות שמספר המשתמשים שהפסדת בבדיקה קטן מ-0.2?

הפתרונות מופיעים מתחת ל-Playground.