計分

在候選項目產生後,其他模型會評分並產生產生的候選項目,並選取要顯示的項目組合。推薦系統可有多個使用不同來源的候選產生器,例如:

示例
  • 矩陣分解模型中的相關項目。
  • 計入個人化作業的使用者功能。
  • "Local" vs”distant”商品,也就是將地理資訊納入考量。
  • 熱門或熱門商品。
  • 社交圖形,也就是好友表示喜歡或推薦的項目。

系統會將這些不同的來源彙整成共同的候選項目清單,再由單一模型評分,並按照這項分數排序。舉例來說,系統可以訓練模型,以預測 YouTube 使用者觀看影片的可能機率,如下所示:

  • 查詢功能 (例如使用者觀看記錄、語言、國家/地區、時間)
  • 影片功能 (例如標題、標記、影片嵌入)

接著,系統可根據模型的預測,將候選集區集區中的影片排名。

為什麼不開放候選人產生器?

由於候選產生器會計算分數 (例如嵌入空間的相似度測量),因此您可能會想將其用於排名。但基於下列原因,請避免這種做法:

  • 有些系統依賴多個候選產生器。這些不同發電機的分數可能無法比較。
  • 如果候選項目數量較少,系統便能使用更多功能和較複雜的模型,藉此更有效地擷取背景資訊。

選擇分數目標函式

如同 ML Issue Framing 簡介,機器學習可能會像許多人差不多的基因一起運作:非常高效地學習您提供的目標,但請務必謹慎留意。這項建議的品質也適用於建議系統。選擇評分函式可能會大幅影響項目的排名,最終影響了建議的品質。

例如:

按一下加號圖示,即可瞭解使用各項目標導致什麼影響。

Google Play 商店首頁的圖片,其中顯示新遊戲和經過更新的遊戲,以及優先顯示底部商品的推薦應用程式。

評分中的偏誤

相較於螢幕上較高的項目,螢幕上顯示在畫面上的機率較低的項目不太可能獲得點擊。不過,在對影片進行評分時,系統通常不知道該連結在螢幕上的位置。查詢所有可能位置的模型過度昂貴。即使查詢多個位置的可行性,系統還是有可能找不到多個排名分數的一致性排名。

解決方案

  • 建立與位置無關的排名。
  • 將所有候選人排在頂端。