הטמעות

הטמעה היא שטח קטן יחסית שבו אפשר לתרגם וקטורים בעלי מאפיינים גבוהים. הטמעות מקלות על הלמידה החישובית על קלט גדול, כמו וקטורים דלילה המייצגים מילים. באופן אידיאלי, הטמעה מתעדת חלק מהסמנטיקה של הקלט על ידי הצבת קלט דומה מבחינה סמנטית זה לצד זה. תוכלו ללמוד הטמעה חוזרת ולהשתמש בה בכל המודלים.

הטמעות

  • קלט: 1,000,000 סרטים ש-500,000 משתמשים בחרו לצפות בהם
  • משימה:המלצה על סרטים למשתמשים

כדי לפתור את הבעיה, נדרשת שיטה כלשהי כדי לקבוע אילו סרטים דומים זה לזה.

רשימה של סרטים מסודרים בשורה אחת משמאל לימין. מתחילים משמאל, 'Shrek', 'The Incredibles','The Triples of Belleוויל', 'Harry Potter', 'Star Wars''&Br

אותה רשימה של סרטים בשקף הקודם, אבל מסודרת בשני מימדים, כך לדוגמה: 'Shrek' היא משמאל ומעל ל-'המדהים

מאפיין דומה לתרשים הקודם, אבל עם ציר ותוויות לכל ריבוע. הסדר של הסרטים הוא: ברבע הראשון בפינה הימנית העליונה, שוברי קופות למבוגרים בלבד כוללים את &מס' 39;מלחמת הכוכבים' עם סרטים של 'הפרשים האפלים'' עם הסרטים 'גיבור' ו'נמר, דרקון חבוי'. הרבייה השנייה הימנית התחתונה היא האמנות למבוגרים בלבד, הכוללת את הסרטים של &Bluu' ו-'Memento' עם & מס' 39; וייקינג וורלד' נוסף לרובע האמנותי למבוגרים. הבית השלישי הוא החלק השמאלי של הסרט 'ארט אין', והוא כולל את הסרט 'המשולשים של בלוויל' וגם 'וואלאס וגרומיט' מתווסף לרובע 'ארט אין ילדים'. הרביעים הרביעיים והסופיים בפינה הימנית העליונה הם 'שוברי קופות' לילדים, שמכילים " 'Shrek' ' The Incredibles' ו- 'הארי פוטר' והסרט 'בית הספר לרוקנרו' נוסף לרובע הילדים לילדים.

אותו סידור כמו השקף האחרון. 'Shrek' ו-'Bleu' מודגשים כדוגמאות לקואורדינטות שלהם במסלול ההטמעה הדו-שלבי.

  • מניחים שתחומי העניין של משתמשים בסרטים יכולים להיות מוסברים פחות או יותר על ידי היבטים
  • כל סרט הופך לנקודה דו-מימדית שבה הערך במאפיין ד' מייצג את מידת ההתאמה של הסרט להיבט הזה
  • ניתן ללמוד הטמעות מנתונים
  • אין צורך בתהליך הדרכה נפרד – שכבת ההטמעה היא רק שכבה נסתרת עם יחידה אחת לכל מאפיין
  • נתונים בפיקוח (למשל, משתמשים שצפו באותם שני סרטים) מתאימים את ההטמעה המוטמעת של המשימה הרצויה
  • המערכות האינטואיטיביות שלנו מלמדות איך לארגן את הפריטים במרחב בתלת-ממד כדי לבצע אופטימיזציה אופטימלית של היעד הסופי.
  • כל דוגמה (שורה במטריצה הזו) היא וקטור דל של תכונות (סרטים) שהמשתמש צפה בהם
  • ייצוג צפוף של הדוגמה הזו: (0, 1, 0, 1, 0, 0, 0, 1)

לא יעיל במונחים של שטח וזמן.

טבלה שבה כל כותרת של עמודה היא סרט וכל שורה מייצגת משתמש ואת הסרטים שבהם הוא צפה.
  • בניית מילון הממפה כל תכונה למספר שלם מ-0, ..., # סרטים - 1
  • ייצוג יעיל של הווקטור הצנוע כסרט שבו המשתמש צפה. יכול להיות שמדובר בסמל: על סמך מיקום העמודה של הסרטים בווקטור הצנוע המוצג בצד שמאל, ניתן לייצג את הסרטים 'השלישיות מבלוויל' ומ'וולאס וגרמיט' וגם 'Memento' אפשר לייצג ביעילות (0,1, 999999)
וקטור דלילה המיוצג כטבלה כאשר כל עמודה מייצגת סרט וכל שורה מייצגת משתמש. הטבלה מכילה את הסרטים מהתרשימים הקודמים, וממוספרת מ-1 עד 999999. כל תא בטבלה נבדק אם משתמש צפה בסרט.

בעיה רגרסית בחיזוי מחירי המכירה בבית:

תרשים של רשת נוירונים עמוקה המשמש לחיזוי מחירי המכירה בבית

בעיה רגרסית בחיזוי מחירי המכירה בבית:

תרשים של רשת נוירונים עמוקה המשמשת לחיזוי המחירים של מבצע בתים
  (הקידוד הווקטורי הוקטן)

בעיה רגרסית בחיזוי מחירי המכירה בבית:

תרשים של רשת נוירונים עמוקה המשמשת לחיזוי המחירים של מבצע בתים
  (מודגשת שכבת הטמעה תלת-מימדית מודגשת)

בעיה רגרסית בחיזוי מחירי המכירה בבית:

תרשים של רשת נוירונים עמוקה המשמשת לחיזוי מחירי המכירה בבית
  (תכונות קלט נוספות של קווי אורך ורוחב מודגשות)

בעיה רגרסית בחיזוי מחירי המכירה בבית:

תרשים של רשת נוירונים עמוקה המשמשת לחיזוי מחירי המכירה בבית
  (תכונות הקלט מתעדפות לכמה שכבות נסתרות מודגשות)

בעיה רגרסית בחיזוי מחירי המכירה בבית:

תרשים של רשת נוירונים עמוקה המשמש לחיזוי מחירי מכירה בבית
  (פלט של רשת הנוירונים העמוקה מודגשת)

סיווג מרובה קטגוריות כדי לחזות ספר בכתב יד:

תרשים של רשת נוירונים עמוקה המשמש לחיזוי ספרות בכתב יד

סיווג מרובה קטגוריות כדי לחזות ספר בכתב יד:

תרשים של רשת נוירונים עמוקה המשמשת לחיזוי הספרות בכתב יד
  (הקידוד של וקטורים דליים מודגשים)

סיווג מרובה קטגוריות כדי לחזות ספר בכתב יד:

תרשים של רשת נוירונים עמוקה המשמש לחיזוי ספרות בכתב יד
  (תכונות אחרות מודגשות)

סיווג מרובה קטגוריות כדי לחזות ספר בכתב יד:

תרשים של רשת נוירונים עמוקה המשמש לחיזוי ספרות בכתב יד
  (הטמעה תלת-ממדית מודגשת)

סיווג מרובה קטגוריות כדי לחזות ספר בכתב יד:

תרשים של רשת נוירונים עמוקה המשמש לחיזוי ספרות בכתב יד
  (שכבות נסתרות מודגשות)

סיווג מרובה קטגוריות כדי לחזות ספר בכתב יד:

תרשים של רשת נוירונים עמוקה המשמש לחיזוי ספרות בכתב יד
  (שכבת הלוגיקה מודגשת)

סיווג מרובה קטגוריות כדי לחזות ספר בכתב יד:

תרשים של רשת נוירונים עמוקה המשמש לחיזוי ספרות בכתב יד
  (שכבת רמת ההדגשה המודגשת)

סינון שיתופי לחיזוי סרטים מומלצים:

תרשים של רשת נוירונים עמוקה המשמשת לחיזוי סרטים מומלצים

סינון שיתופי לחיזוי סרטים מומלצים:

תרשים של רשת נוירונים עמוקה המשמשת לחיזוי סרטים מומלצים

סינון שיתופי לחיזוי סרטים מומלצים:

תרשים של רשת נוירונים עמוקה המשמשת לחיזוי סרטים מומלצים

סינון שיתופי לחיזוי סרטים מומלצים:

תרשים של רשת נוירונים עמוקה המשמשת לחיזוי סרטים מומלצים

סינון שיתופי לחיזוי סרטים מומלצים:

תרשים של רשת נוירונים עמוקה המשמש לחיזוי הסרטים שכדאי להמליץ עליהם (תכונות אחרות מודגשות)

סינון שיתופי לחיזוי סרטים מומלצים:

תרשים של רשת נוירונים עמוקה המשמשת לחיזוי הסרטים שכדאי להמליץ עליהם (שכבות מודגשות מודגשות)

סינון שיתופי לחיזוי סרטים מומלצים:

תרשים של רשת נוירונים עמוקה המשמשת לחיזוי סרטים מומלצים

רשת עומק

  • כל אחת מהיחידות המוסתרות תואמת למאפיין (תכונה מוסתרת)
  • משקולות הקצה בין סרט לשכבה נסתרת הן ערכי קואורדינטות
  • תרשים עץ של רשת נוירונים עמוקה עם צמתים בשכבה התחתונה המחוברת לשלוש נקודות בשכבה הבאה.

תצוגה גיאומטרית של הטמעת סרט יחיד

נקודה במרחב תלת-מימדי המתאים לצומת השכבה התחתונה בתרשים הרשת הנוירולוגית.
  • הטמעות במימד גבוה יותר יכולות לייצג בצורה מדויקת יותר את הקשרים בין ערכי הקלט
  • אבל ככל שיש יותר מאפיינים, כך גובר הסיכוי להיבנות ואימוני כושר איטיים יותר
  • כלל טכני של תמונה ממוזערת (נקודת התחלה טובה, אך יש לשפר את הנתונים באמצעות נתוני האימות):
  • $$ dimensions \approx \sqrt[4]{possible\;values} $$
  • הטמעת פריטי מפה (למשל סרטים, טקסט,...) לווקטורים אמיתיים בעלי מימדים נמוכים באופן שבו פריטים דומים קרובים זה לזה
  • ניתן גם להטמיע נתונים על נתונים צפופים (למשל, אודיו) כדי ליצור מדד משמעותי דומה
  • הטמעה משותפת של מגוון סוגי נתונים (למשל טקסט, תמונות, אודיו וכו') מגדירה דמיון ביניהם