機器學習詞彙表:推薦系統

透過集合功能整理內容 你可以依據偏好儲存及分類內容。

本頁提供建議系統詞彙表。如要查看所有詞彙詞彙,請按這裡

C

候選人產生

#recsystems

建議系統選擇的初始建議組合。例如,提供 10 萬本書的書店。候選產生階段可為特定使用者建立更少的合適書籍清單,例如 500。但即使是 500 本書籍對太多使用者推薦太多,後續建議系統的推薦階段 (例如評分重新排名) 會減少 500 則減少到更小、更實用的建議。

協作篩選

#recsystems

根據許多其他使用者的興趣,進行預測。協作篩選功能通常用於建議系統

I

項目矩陣

#recsystems

建議系統中,矩陣分解是由矩陣分解產生的矩陣,其中含有各個項目的隱含信號。項目矩陣的每一列都包含所有所有項目的單一隱含功能值。以電影推薦系統為例,項目矩陣中的每個資料欄都代表一部電影。潛在信號可能代表類型,或者可能較不易解讀類型、類型、電影年齡或其他因素的複雜互動。

項目矩陣的欄數與要分解的目標矩陣數量相同。舉例來說,假設電影推薦系統評估了 10,000 部電影,則項目矩陣會有 10,000 欄。

items

#recsystems

「推薦系統」中,系統推薦的實體。例如,影片是應用程式商店推薦的項目,而書籍則是書店推薦的項目。

M

矩陣分解

#recsystems

在數學中,用於找出圓點產品接近目標矩陣的矩陣。

推薦系統中,目標矩陣通常會保留使用者'對項目的評分。例如,電影推薦系統的目標矩陣應如下所示,其中正整數為使用者評分,0 則代表使用者未對該電影評分:

  卡薩布蘭加 費城故事 黑豹 神力女超人 粗俗故事
使用者 1 5.0 3.0 0.0 2.0 0.0
使用者 2 4.0 0.0 0.0 1.0 5.0
使用者 3 3.0 1.0 4.0 5.0 0.0

電影推薦系統旨在為未分級的電影預測使用者評分。例如,使用者 1 會喜歡「Black Panther」嗎?

建議系統的一種做法是使用矩陣因數來產生下列兩個矩陣:

舉例來說,如果對三個使用者和五個項目使用矩陣分解,則可能會產生下列使用者矩陣和項目矩陣:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

使用者矩陣和項目矩陣的圓點產品會產生建議矩陣,不僅包含原始的使用者評分,還包含每位使用者未看過的電影預測。例如,使用者 1' 的評分是 Casablanca,也就是 5.0。在建議矩陣中,對應該儲存格的點產品應約為 5.0,且:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

更重要的是,使用者 1 是否喜歡「Black Panther」?使用與第一列和第三欄對應的圓點產品後,預測評分為 4.3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

矩陣分解通常會產生使用者矩陣和項目矩陣,而該矩陣的總數遠高於目標矩陣。

R

推薦系統

#recsystems

用來為每位使用者選擇一組來自大型資料庫的相對「較小」項目。例如,影片推薦系統可能會從 100,000 部影片中推薦兩部影片,為單一使用者選取 CasablancaPhiladelphia Story,為另一位使用者選取 Wonder WomanBlack Panther。影片推薦系統可能會根據下列因素推薦內容:

  • 同使用者觀看或觀看過的電影。
  • 類型、導演、演員、指定客層...

重新排名

#recsystems

「推薦系統」的最後一個階段,在計算分數時,系統可能會根據其他 (通常是非機器學習) 演算法重新計算已評分的項目。重新排名功能會評估分數階段產生的項目清單,並採取下列動作:

  • 消除使用者已購買的商品。
  • 提升新鮮項目的分數。

S

計分

#recsystems

推薦系統的其中一個部分,為候選產生階段產生的每個項目提供值或排名。

U

使用者矩陣

#recsystems

推薦系統中,矩陣分解是由矩陣分解產生的嵌入向量,會保留使用者的偏好設定。使用者矩陣的每一列都會保留單一使用者不同潛在信號的相對強度相關資訊。以電影推薦系統為例,在此系統中,使用者矩陣中的潛在信號代表每位使用者對特定類型的興趣,或是較不易解讀的信號,涉及多個因素的複雜互動。

使用者矩陣中每個隱形特徵都有一個資料欄,每位使用者都有一個資料列。也就是說,使用者矩陣的列數與要計算的目標矩陣數量相同。舉例來說,假設電影推薦系統為 1,000,000 位使用者,則使用者矩陣會有 1,000,000 列。

W

加權替代最小正方形 (WALS)

#recsystems

建議系統矩陣分解中,最小化目標函式的演算法,可減少缺少範例的權重。WALS 會藉由修正資料列分解與資料欄因數,藉此減少原始矩陣和重建之間的加權方形錯誤。每項最佳化項目都能以正方形轉換最佳化的形式解決。詳情請參閱建議系統課程