דירוג מחדש

בשלב האחרון של מערכת ההמלצות, המערכת יכולה לדרג מחדש את המועמדים כדי לשקול קריטריונים או מגבלות נוספים. אחת מהגישות לדירוג מחדש היא שימוש במסננים שמסירים כמה מועמדים.

עוד גישה שמדרגה מחדש היא לשנות באופן ידני את הציון שהוחזר על ידי המדרג.

בקטע הזה מתוארים בקצרה עדכניות, גיוון והגינות. הגורמים האלה הם בין גורמים רבים שיכולים לעזור לכם לשפר את מערכת ההמלצות שלכם. חלק מהגורמים האלה דורשים בדרך כלל שינוי של שלבים שונים בתהליך. בכל קטע יש פתרונות שאפשר ליישם בנפרד או ביחד.

עדכניות

רוב מערכות ההמלצות נועדו לשלב מידע עדכני על השימוש, כמו היסטוריית המשתמשים הנוכחית והפריטים החדשים ביותר. שומרים על עדכניות המודל כדי לעזור למודלים לקבל המלצות טובות.

פתרונות

  • כדאי להריץ שוב את ההדרכות כדי ללמוד כמה שיותר על נתוני האימון הכי עדכניים. אנחנו ממליצים להתחיל את האימון כדי שהמודל לא יהיה נחוץ ללמוד מחדש מאפס. התחממות יכולה לקצר משמעותית את זמן האימון. לדוגמה, בפקטור של מטריצות, יש להתחיל את ההטמעות של פריטים שהיו קיימים במופע הקודם של המודל.
  • יצירת משתמש "medium" כדי לייצג משתמשים חדשים במודלים של מטריצת מטריצות. אין צורך בהטמעה זהה עבור כל משתמש – אפשר ליצור אשכולות של משתמשים על סמך תכונות המשתמש.
  • יש להשתמש ב-DNN כמו דגם Softmax או במודל עם שני גדלים. מכיוון שהמודל מקבל וקטורים של תכונות בתור קלט, הוא יכול לפעול בתגובה לשאילתה או לפריט שלא נראו במהלך האימון.
  • הוספת גיל למסמך כתכונה. לדוגמה, YouTube יכול להוסיף גיל של סרטון או את הזמן של הצפייה האחרונה שלו כתכונה.

תמונה של ארבעה סרטונים מומלצים בנושא ינשופים.

מגוון רחב

אם המערכת תמיד ממליצה על פריטים "closest" עבור השאילתה של הטמעה, המועמדים בדרך כלל דומים מאוד זה לזה. חוסר הגיוון הזה יכול לפגוע בחוויית המשתמש. לדוגמה, אם YouTube פשוט ממליץ על סרטונים הדומים מאוד לסרטון שהמשתמש צופה בו כרגע, למשל סרטונים מסוג ינשוף (כפי שמתואר באיור), סביר להניח שהמשתמשים יאבדו עניין במהירות.

פתרונות

  • מאמנים מגוון מחוללי מועמדים באמצעות מקורות שונים.
  • מאמנים כמה מדרגים באמצעות פונקציות אובייקטיביות שונות.
  • כדי להבטיח גיוון, יש להעלות מחדש פריטים המבוססים על ז'אנר או על מטא-נתונים אחרים.

יחס הוגן

המודל שלכם צריך להתייחס לכל המשתמשים בצורה הוגנת. לכן, ודאו שהמודל לא לומד מהטיות לא מודעות בנתוני האימון.

פתרונות

  • לכלול נקודות מבט מגוונות בעיצוב ובפיתוח.
  • אימון מודלים של למידת מכונה (ML) בקבוצות נתונים מקיפות. הוסיפו נתוני עזר כשהנתונים שלכם קטנים מדי (לדוגמה, כשקטגוריות מסוימות מיוצגות בצורה נמוכה מדי).
  • לעקוב אחר מדדים (למשל, דיוק ושגיאה מוחלטת) בכל קבוצה דמוגרפית כדי לצפות בהטיות.
  • יצירת מודלים נפרדים לקבוצות שלא מקבלות מספיק מידע.