機器學習詞彙表:推薦系統

本頁包含推薦系統詞彙表字詞。如需所有詞彙表字詞,請按這裡

C

候選產生

#recsystems

建議系統選擇的初始建議集。舉例來說,假設有一個書店提供 100,000 本書籍。候選產生階段會為特定使用者建立較少的適用書籍清單,例如 500 本。然而,即便是 500 本書,還是太多無法供使用者推薦。後續、費用更高、價格更高的推薦系統 (例如評分重新排名) 將 500 個階段減少為更小、更實用的建議組合。

協同過濾

#recsystems

根據其他使用者的興趣,對某個使用者的興趣進行預測。協同篩選通常用於推薦系統

I

項目矩陣

#recsystems

推薦系統中,由矩陣分解產生的嵌入向量矩陣,其中包含每個項目的潛在信號。項目矩陣的每一列都包含所有項目的單一潛在特徵值。以電影推薦系統為例,項目矩陣中的每個欄都代表一部電影。潛在信號可能代表類型,或較難以理解涉及類型、星星、電影年齡或其他因素的複雜互動信號。

項目矩陣的欄數與正在因式分解的目標矩陣相同。舉例來說,假設某個電影推薦系統可評估 10,000 個電影標題,項目矩陣會有 10,000 個欄。

items

#recsystems

「建議系統」中,系統建議的實體。舉例來說,影片是影片商店推薦的項目,書籍則是書店推薦的項目。

M

矩陣分解

#recsystems

在數學中,一種尋找矩陣的機制,其點積值與目標矩陣差不多。

推薦系統中,目標矩陣經常會保留使用者的項目評分。例如,電影推薦系統的目標矩陣可能如下所示,其中正整數代表使用者評分,0 代表使用者未對電影評分:

  卡薩布蘭加 費城的故事 黑豹 神力女超人 閃爍小說
使用者 1 5.0 3.0 0.0 2.0 0.0
使用者 2 4.0 0.0 0.0 1.0 5.0
使用者 3 3.0 1.0 4.0 5.0 0.0

電影推薦系統旨在預測未分級電影的使用者評分。例如,使用者 1 是否會像「Black Panther」一樣?

推薦系統的一種做法是使用矩陣分解來產生以下兩個矩陣:

例如,對三位使用者使用矩陣分解,這五個項目可能產生下列使用者矩陣和項目矩陣:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

使用者矩陣與項目矩陣的內積可產生推薦矩陣,此矩陣不僅包含原始使用者評分,還會針對每位使用者未看過的電影預測結果。舉例來說,假設使用者 1 的《Casablanca》評分是 5.0。與推薦矩陣中該儲存格對應的點積點應該約為 5.0 左右,如下所示:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

更重要的是,使用者 1 是否會像「Black Panther」?如果取得與第一列對應的內積,第三欄則會產生 4.3 的預測評分:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

矩陣分解通常會產生使用者矩陣與項目矩陣,而兩者相加,比目標矩陣更精簡。

R

推薦系統

#recsystems

這個系統會從大型語料庫中,為每位使用者選擇一組相對較少的理想項目。舉例來說,影片推薦系統可能會推薦 100,000 部影片的語料庫中的 2 部影片,為一位使用者選取「Casablanca」和「The Philadelphia Story」,另一個則選取「Wonder Woman」和「Black Panther」。影片推薦系統可能會根據下列因素提供推薦內容:

  • 類似使用者已評分或觀看的電影。
  • 類型、導演、演員、指定客層...

重新排名

#recsystems

「建議系統」的最後階段,是指在哪些計分項目可能會根據其他 (通常是非機器學習) 演算法重新評分。重新排名功能會評估「評分」階段產生的項目清單,並採取以下幾種動作:

  • 排除使用者已購買的商品。
  • 提高新鮮道具的得分。

計分

#recsystems

推薦系統的一部分,可為候選產生階段產生的每個項目提供值或排名。

U

使用者矩陣

#recsystems

推薦系統中,由矩陣分解產生的嵌入向量,保存了使用者偏好設定的相關潛在信號。使用者矩陣的每一列都包含關於單一使用者各種潛在信號的相對強度資訊。以電影推薦系統為例。在這個系統中,使用者矩陣中的潛在信號可能代表每位使用者對特定類型的興趣,或可能更難以解讀涉及複雜互動的信號。

使用者矩陣將每個潛在特徵各有一欄,分別代表不同的使用者。也就是說,使用者矩陣的資料列數與正在因式分解的目標矩陣相同。例如,假設有一個適用於 1,000,000 位使用者的電影推薦系統,使用者矩陣會有 1,000,000 列。

加權交替最小平方 (WALS)

#recsystems

用來在推薦系統矩陣分解期間盡量減少目標函式的演算法,可降低遺漏範例的權重。WALS 會在修正資料列因式分解和資料欄因式分解之間交錯,藉此將原始矩陣與重新建構之間的加權平方誤差降至最低。每項最佳化作業都能透過最小的凸面最佳化解決。詳情請參閱推薦系統課程