למה כדאי להשתמש בסינון ובשיתוף פעולה?

יתרונות

לא נדרש ידע בדומיין

אין צורך בידע דומיין, מפני שההטמעות לומדות באופן אוטומטי.

יעילות

המודל יכול לעזור למשתמשים לגלות תחומי עניין חדשים. יכול להיות שתבודד מערכת ה-ML, גם אם המשתמש לא התעניין בפריט מסוים, אבל יכול להיות שהמודל ימליץ עליו כי משתמשים דומים מתעניינים בו.

נקודת התחלה מצוינת

במידה מסוימת, המערכת צריכה רק את מטריצת המשוב כדי לאמן מודל של מטריצת גורמים. ספציפית, המערכת לא זקוקה לתכונות הקשריות. בפועל, ניתן להשתמש בו כמחוללים מרובים של מועמדים.

חסרונות

אין אפשרות לטפל בפריטים חדשים

החיזוי של המודל עבור צמד נתון (משתמש, פריט) הוא תוצר הנקודה של ההטמעות התואמות. לכן, אם פריט מסוים לא מופיע במהלך האימון, המערכת לא יכולה ליצור עבורו הטמעה ולא ניתן לשלוח שאילתות לגבי המודל עם הפריט. הבעיה הזו נקראת בדרך כלל בעיה במצב התחלתי (cold-start). עם זאת, השיטות הבאות יכולות לטפל בבעיה את ההפעלה הקרה במידה מסוימת:

  • הקרנה ב-WALS. מכיוון שפריט חדש \(i_0\) לא מוצג באימון, אם יש למערכת כמה אינטראקציות עם המשתמשים, המערכת יכולה לחשב בקלות את ההטמעה של הפריט \(v_{i_0}\) , בלי שתצטרכו לאמן מחדש את המודל כולו. המערכת פשוט צריכה לפתור את המשוואה הבאה או את הגרסה המשוקללת:

    \[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]

    המשוואה הקודמת תואמת לאיטרציה אחת ב-WALS: ההטמעות של המשתמשים נשמרות קבועות, והמערכת פותרת את ההטמעה של פריט \(i_0\). ניתן לעשות זאת גם עבור משתמש חדש.

  • היוריסטיקה של יצירת פריטים טריים. אם אין למערכת אינטראקציות, המערכת יכולה להעריך את ההטמעה שלה באמצעות ממוצע הטמעה של פריטים מאותה קטגוריה, מאותו מעלה תוכן (ב-YouTube) וכן הלאה.

קשה לכלול תכונות בצד של שאילתה/פריט

תכונות בצד הן כל התכונות מלבד השאילתה או מזהה הפריט. לגבי המלצות על סרטים, התכונות האפשריות עשויות לכלול מדינה או גיל. הכללת תכונות צדדיות זמינות משפרת את איכות המודל. אומנם לא קל לכלול תכונות צדדיות ב-WALS, אבל יצירת הכללה של WALS מאפשרת זאת.

כדי להכליל את WALS, מרחיבים את מטריצת הקלט עם התכונות על ידי הגדרת מטריצת חסימה \(\bar A\), שבה:

  • חסימה (0, 0) היא מטריצת המשוב המקורית \(A\).
  • חסימה (0, 1) היא קידוד רב-תכונות של תכונות המשתמש.
  • חסימה (1, 0) היא קידוד חם של תכונות הפריט.