ציון

לאחר יצירת המועמדים, מודל אחר מדרג ומדרג את המועמדים שנוצרו כדי לבחור את קבוצת הפריטים שתוצג. למערכת ההמלצות יכולים להיות מספר מחוללי מועמדים שמשתמשים במקורות שונים, למשל:

דוגמאות
  • פריטים קשורים ממודל חישובי מטריצות.
  • תכונות משתמש שמביאות בחשבון התאמה אישית.
  • "Local" לעומת "distant" items; כלומר, תוך התייחסות למידע גיאוגרפי.
  • פריטים פופולריים או פופולריים.
  • תרשים חברתי. כלומר, פריטים שחברים אהבו או המליצו עליהם.

המערכת משלבת את המקורות השונים האלה במאגר משותף של מועמדים, שמדורגים לפי מודל יחיד ומדורגים לפי אותו ציון. לדוגמה, המערכת יכולה לאמן מודל כדי לחזות את ההסתברות לכך שמשתמש יצפה בסרטון ב-YouTube על סמך:

  • תכונות שאילתה (לדוגמה, היסטוריית צפייה של משתמשים, שפה, מדינה, שעה)
  • תכונות של סרטונים (לדוגמה: שם, תגים, הטמעת סרטון)

לאחר מכן המערכת יכולה לדרג את הסרטונים במאגר המועמדים בהתאם לחיזוי של המודל.

למה שלא נותנים לניקוד מועמד?

מאחר שמחוללי המועמדים מחשבים את הציון (למשל מידת הדמיון במרחב ההטמעה), ייתכן שתתפתו להשתמש בהם גם כדי לבצע דירוג. עם זאת, כדאי להימנע משימוש בשיטה הזו מהסיבות הבאות:

  • חלק מהמערכות מסתמכות על מחוללי מועמדים מרובים. לא ניתן להשוות בין הציונים של הגנרטורים השונים האלה.
  • עם מאגר קטן יותר של מועמדים, המערכת יכולה להרשות לעצמה להשתמש ביותר תכונות ובמודל מורכב יותר שעשוי ללכוד בצורה טובה יותר את ההקשר.

בחירת פונקציה אובייקטיבית לציון

כפי שאולי תזכורו ממבוא לבעיה בלמידת מכונה (ML), למידת מכונה יכולה להתנהג כמו ג'ינג'י שובב: שמחתי מאוד ללמוד את המטרה שאתם מספקים, אבל עליכם להיזהר בכל מה שתרצו. האיכות הגרועה הזו חלה גם על מערכות ההמלצות. בחירת ניקוד יכולה להשפיע באופן דרמטי על דירוג הפריטים, ובסופו של דבר על איכות ההמלצות.

לדוגמה:

לחצו על סמלי הפלוס כדי להבין מה קורה בעקבות השימוש בכל אובייקט.

תמונה של דף הבית של
 חנות Google Play שמוצגים בה משחקים חדשים ומעודכנים, וכן
 אפליקציות מומלצות עם הדגשה של הפריטים התחתונים.

הטיה מיצוב בניקוד

יש סיכוי נמוך יותר לכך שפריטים שמופיעים במסך יהיו נמוכים יותר מקליקים על פריטים שמופיעים במיקום גבוה יותר במסך. עם זאת, כאשר מודדים סרטונים, המערכת בדרך כלל לא יודעת היכן במסך יופיע קישור לסרטון הזה. שליחת שאילתות למודל בכל המיקומים האפשריים היא יקרה מדי. גם אם לא ניתן היה לשלוח שאילתות למספר מיקומים, ייתכן שהמערכת עדיין לא תזהה דירוג עקבי בין דירוגים מרובים.

פתרונות

  • יוצרים דירוגים עצמאיים.
  • דירוג כל המועמדים כאילו הם במיקום העליון במסך.