מילון מונחים ללמידת מכונה: מערכות המלצה

דף זה מכיל מונחי מילון מונחים של מערכות המלצות. לכל המונחים במילון המונחים, לחצו כאן.

C

יצירת מועמדים

#recsystems

קבוצת ההמלצות הראשונית שנבחרה על ידי מערכת ההמלצות. לדוגמה, נניח שיש לכם חנות ספרים שיש בה 100,000 כותרים. שלב יצירת המועמד יוצר רשימה קטנה בהרבה של ספרים מתאימים למשתמש מסוים, למשל 500. אבל גם 500 ספרים הם הרבה יותר מדי מכדי להמליץ למשתמש. השלבים הבאים ויקרים יותר של מערכת ההמלצות (כמו ציון ודירוג מחדש) מפחיתים את 500 ההמלצות האלו לקבוצת המלצות קטנה ושימושית הרבה יותר.

סינון שיתופי

#recsystems

יצירת תחזיות לגבי תחומי העניין של משתמש אחד על סמך תחומי העניין של משתמשים רבים אחרים. הרבה פעמים משתמשים בסינון שיתופי במערכות המלצה.

I

מטריצת פריטים

#recsystems

במערכות המלצה, מטריצה של וקטורים של הטמעה שנוצרה על ידי פירוק לגורמים של מטריצה ומכילה אותות נסתרים לגבי כל פריט. כל שורה במטריצת הפריטים מכילה את הערך של תכונה לטנטית אחת לכל הפריטים. לדוגמה, נניח שיש מערכת המלצות על סרטים. כל עמודה במטריצת הפריטים מייצגת סרט אחד. האותות הלטנטיים עשויים לייצג ז'אנרים, או שהם קשים יותר לפירוש, שיש בהם אינטראקציות מורכבות בין ז'אנרים, כוכבים, גילאי הסרט או גורמים אחרים.

במטריצת הפריטים יש אותו מספר עמודות כמו במטריצת היעד שעוברת לפירוק לגורמים. לדוגמה, בהינתן מערכת המלצות על סרטים שבודקת 10,000 שמות של סרטים, מטריצת הפריטים תכלול 10,000 עמודות.

items

#recsystems

במערכת ההמלצות, הישויות שהמערכת ממליצה. לדוגמה, סרטונים הם הפריטים שמומלצים בחנות סרטונים, בעוד שספרים הם הפריטים שמומלצים על ידי חנות ספרים.

M

פירוק לגורמים של מטריצות

#recsystems

במתמטיקה, מנגנון למציאת מטריצות שמכפלת הנקודות שלהן קרובה למטריצת יעד.

במערכות המלצות, מטריצת היעד כוללת בדרך כלל את הדירוגים של המשתמשים בפריטים. לדוגמה, מטריצת היעד של מערכת המלצות על סרטים יכולה להיראות בערך כך, שבה המספרים השלמים החיוביים הם דירוגי משתמשים ו-0 פירושו שהמשתמש לא דרג את הסרט:

  קזבלנקה הסיפור של פילדלפיה הפנתר השחור וונדר וומן ספרות זולה
משתמש 1 5.0 3.0 0.0 2.0 0.0
משתמש 2 4.0 0.0 0.0 1.0 5.0
משתמש 3 3.0 1.0 4.0 5.0 0.0

מערכת ההמלצות על סרטים שואפת לחזות את דירוגי המשתמשים לסרטים ללא סיווג תוכן. לדוגמה, האם משתמש 1 כמו הפנתר השחור?

אחת הגישה למערכות של המלצות היא להשתמש בפקטורים של מטריצות כדי ליצור את שתי המטריצות הבאות:

לדוגמה, שימוש בפירוק לגורמים של מטריצות על שלושת המשתמשים וחמישה פריטים עלול להניב את מטריצת המשתמשים ואת מטריצת הפריטים הבאים:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

מכפלת הנקודות של מטריצת המשתמשים ומטריצת הפריטים יוצרת מטריצת המלצות שמכילה לא רק את דירוגי המשתמשים המקוריים, אלא גם את החיזויים לסרטים שכל משתמש לא ראה. לדוגמה, נניח שקיבלתם את הדירוג של משתמש 1 לקזבלנקה, שהוא 5.0. מכפלת הנקודות שתואמת לתא הזה במטריצת ההמלצות אמורה להיות בערך 5.0, והוא:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

חשוב מכך, האם משתמש 1 יהיה כמו הפנתר השחור? אם משתמשים במוצר עם הנקודות שתואם לשורה הראשונה ובעמודה השלישית, יתקבל דירוג חזוי של 4.3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

פירוק לגורמים של מטריצות בדרך כלל יוצר מטריצת משתמשים ומטריצת פריטים, שביחד הם קומפקטיים הרבה יותר ממטריצת היעד.

R

מערכת המלצות

#recsystems

מערכת שבוחרת לכל משתמש קבוצה קטנה יחסית של פריטים רצויים מתוך אוסף גדול. לדוגמה, מערכת המלצות על סרטונים יכולה להמליץ על שני סרטונים מתוך אוסף של 100,000 סרטונים, ולבחור באפשרות קזבלנקה וסיפור פילדלפיה למשתמש אחד, ובאפשרות וונדר וומן והפנתר השחור למשתמש אחר. מערכת ההמלצות על סרטונים עשויה לבסס את ההמלצות שלה על גורמים כמו:

  • סרטים שמשתמשים דומים דירגו או צפו בהם.
  • ז'אנר, במאים, שחקנים, יעד דמוגרפי...

דירוג מחדש

#recsystems

השלב האחרון במערכת ההמלצות, שבו ניתן לתת ציון מחדש לפריטים שקיבלו ציון לפי אלגוריתם אחר (בדרך כלל לא ML). הדירוג מחדש מעריך את רשימת הפריטים שנוצרו על ידי שלב הציון, בעקבות פעולות כמו:

  • הסרת פריטים שהמשתמש כבר רכש.
  • משפר את הציון של פריטים חדשים יותר.

S

ניקוד

#recsystems

החלק במערכת ההמלצות שמספק ערך או דירוג לכל פריט שנוצר בשלב יצירת הצעות.

U

מטריצת משתמשים

#recsystems

במערכות המלצה, וקטור הטמעה שנוצר על ידי פירוק לגורמים של מטריצה ומכיל אותות לטנטיים לגבי העדפות המשתמש. כל שורה במטריצת המשתמשים מכילה מידע על העוצמה היחסית של אותות נסתרים שונים למשתמש יחיד. לדוגמה, נניח שיש מערכת המלצות על סרטים. במערכת הזו, האותות הלטנטיים במטריצת המשתמשים עשויים לייצג את תחומי העניין של כל משתמש בז'אנרים מסוימים, או שהם עשויים להיות מסובכים לפירוש אותות שכוללים אינטראקציות מורכבות על פני מספר גורמים.

במטריצת המשתמשים יש עמודה לכל תכונה סמויה ושורה לכל משתמש. כלומר, במטריצת המשתמשים יש אותו מספר שורות כמו במטריצת היעד שמחולקת לגורמים. לדוגמה, בהינתן מערכת המלצות על סרטים ל-1,000,000 משתמשים, מטריצת המשתמשים תכלול 1,000,000 שורות.

W

ריבועים מזרחיים חלופיים משוקללים (WALS)

#recsystems

אלגוריתם למזעור פונקציית המטרה במהלך פירוק לגורמים של המטריצה במערכות המלצה, שמאפשר להפחית את המשקל של הדוגמאות החסרות. WALS מצמצמת את השגיאה המשוקללת בריבוע בין המטריצה המקורית והשחזור על ידי תיקון של פירוק לגורמים של השורות והפירוק לגורמים של העמודות. אפשר לפתור כל אחת מהאופטימיזציות האלה באמצעות אופטימיזציה קמורה של ריבועים לפחות. פרטים נוספים זמינים בקורס Recommendation Systems.