依內容篩選

內容式篩選功能會根據項目過去的操作或明確意見回饋,使用項目功能來推薦類似使用者的其他項目。

為了示範以內容為基礎的篩選功能,請手動設計 Google Play 商店的某些功能。下圖顯示特徵矩陣,每一列代表一個應用程式,而每個資料欄代表一個特徵。功能可能包括類別 (例如教育、休閒、健康)、應用程式的發布者等等。為簡單起見,假設這個特徵矩陣為二進位檔:非零值表示應用程式具備該功能。

您也會在同一個功能空間中代表使用者,使用者可以明確提供某些使用者相關功能,舉例來說,使用者在自己個人資料中選取「娛樂應用程式」;視先前安裝的應用程式而定,其他功能則可能是隱含的。舉例來說,使用者安裝了 Science R Us 所發布的其他應用程式。

模型應推薦與使用者相關的商品。因此,您必須先選擇相似度指標 (例如點產品)。然後,您必須設定系統,以根據這個相似性指標為各個候選項目進行評分。請注意,這些最佳化建議僅適用於該使用者,因為模型並未使用其他使用者的任何資訊。

矩陣的圖片,其中顯示可能推薦的使用者和應用程式

使用 Dot Product 進行相似度評估

假設使用者嵌入 \(x\) 和應用程式嵌入 \(y\) 都是二元向量。自\(\langle x, y \rangle = \sum_{i = 1}^d x_i y_i\)起,只要 \(x\) 和 \(y\) 同時顯示一項功能,系統就會加總 1。換句話說, \(\langle x, y \rangle\) 是同時啟用這兩個向量的功能數量。高點產品後代表較常見的功能,因此相似度較高。

親自體驗!

計算每個應用程式問題中在每個點數上的產品。然後使用這些資訊回答以下問題:

我們該推薦哪個應用程式?
由 Science R Us 打造的教育應用程式。
答對了!這項商品含有最多點數產品 (2)。我們的使用者非常喜歡科學和教育應用程式
「醫療照護」應用程式所建立的健康應用程式。
這個應用程式的評分為 1。這不是系統給予的最壞建議,但不是最好的事。
TimeWastr 打造的休閒應用程式。
這個應用程式實際上在 0 的最低點產品為 0。我們的使用者並未對遊戲等休閒應用程式感興趣。