コラボレーションフィルタリング

コンテンツベースのフィルタリングの制限に対処するため、コラボレーションフィルタリングでは、ユーザーと、推奨案を提示します。これにより、偶発的な提言に対するすなわち協調フィルタリングモデルは、ユーザーの興味、関心に基づいてユーザー A に商品をおすすめできます。ユーザー B が抽出されます。さらにエンべディングは自動化されています。

おすすめの映画の例

トレーニングデータが次の要素で構成される映画のレコメンデーションシステムについて考えてみましょう。フィードバックマトリクスの正誤問題:

各行はユーザーを表します。
各列はアイテム（映画）を表します。

映画に関するフィードバックは、次の 2 つのカテゴリのいずれかに分類されます。

明示的 - 特定の映画をどの程度高く評価したかを指定します。数値で評価します
暗黙的 - ユーザーが映画を視聴した場合、システムは表示されます。

簡略化のために、フィードバック行列はバイナリであると仮定します。つまり 1 は映画に関心があることを示します。

ユーザーがホームページにアクセスすると、システムは映画をおすすめする次の両方に基づく:

ユーザーが過去に高く評価した映画との類似性
類似のユーザーが高く評価した映画

説明のため、映画のいくつかの特徴をハンドエンジニアリングしてみましょう。次の表の説明をご覧ください。

映画	評価	説明
ダークナイトライジング	PG-13	核戦争からゴッサムシティを救うために取り組むバットマンこの動画の続編では The Dark Knight DC を舞台にコミックの世界。
「ハリー・ポッターと賢者の石」	PG	孤児の少年は自分が魔法使いであることに気づき、ホグワーツ学校魔法と魔法使い、初の戦いに挑む魔法のヴォルデモート王です。
シュレック	PG	愛らしい鬼とロバの相棒がミッションに挑むフィオナ王女を救出することにした。ドラゴンに城の中に閉じこめられていたのです。
ベルヴィルの 3 組組曲	PG-13	プロのサイクラーチャンピオンが誘拐された。ツール・ド・フランス彼の祖母と太りすぎの犬が彼を救うために海外に旅立ちました。 3 人の年配のジャズシンガーの助けを借りることになりました。
メメント	R	健全な女の子は妻の殺人事件を解決しようと熱心に奮闘する体に手がかりを入れてタトゥーを入れました。

1D エンベディング

各映画に、 \([-1, 1]\) でそのスカラーを表すスカラーを映画の対象が子ども（負の値）か大人（正の値）かを指定します。また、説明を表すスカラーを \([-1, 1]\) の各ユーザーに割り当てたとします。子ども向けの映画（-1 に近い値）または大人に対するユーザーの興味や関心（+1 に近い）が表示されます。映画の埋め込みとユーザーの積ユーザーが期待する映画のエンべディングは高く（1 に近い）必要があります。できます。

1 次元のエンベディング空間に沿って配置された複数の映画とユーザーを示す画像。この軸に沿った各映画の位置は、子ども向け映画（左）と成人向け映画（右）のどちらであるかを示します。ユーザーの位置は、子ども向け映画または成人向け映画への関心を示しています。

下の図では、各チェックマークは、特定の映画が視聴されたユーザーが視聴した動画の数。3 人目と 4 人目のユーザーの好みは 3 人目のユーザーは子ども向けの映画を好む 4 人目のユーザーは成人向けの映画を好みますただし、1 つ目と 2 つ目のユーザー設定が、この 1 つの機能では十分に説明されていないからです。

フィードバックマトリックスの画像。行はユーザー、列は映画に対応しています。各ユーザーと各映画は 1 次元のエンベディングにマッピングされます（前の図を参照）。2 つのエンベディングの積がフィードバックマトリックスのグラウンドトゥルース値を近似します。

2D 埋め込み

1 つの機能だけでは、すべてのユーザーの好みを説明するには不十分でした。克服するためこの問題です。では、2 つ目の特徴量を大ヒット映画でもアート系映画でも2 つ目の特徴は、単語のシーケンスを各映画を次の 2 次元の埋め込みで表します。

2 次元のエンベディング空間に配置された複数の映画とユーザーを示す画像。横軸に沿った各映画の位置は、それが子ども向けの映画（左）か成人向け映画（右）かを示します。縦軸の位置は大ヒット映画（上）かアートハウス映画（下）かを示します。ユーザーの掲載順位は、各カテゴリにおけるユーザーの興味 / 関心を反映したものになります。

ここでも、わかりやすく説明するために、ユーザーを同じエンベディング空間に配置します。フィードバックマトリックスを使用します。つまり、（ユーザーとアイテム）のペアごとに、ユーザーエンベディングとアイテムエンベディングのドット積が近接するユーザーが映画を視聴した場合は 1、それ以外の場合は 0 に設定されます。

同じフィードバックマトリックスの画像。今回は、各ユーザーと各映画が 2 次元のエンベディングにマッピングされます（前の図を参照）。これにより、2 つのエンベディングのドット積がフィードバックマトリックスのグラウンドトゥルース値を近似します。

この例では、エンベディングを手作業でエンジニアリングしました。実際にはエンべディングは協調フィルタリングの能力である自動的に学習できる構築できます次の 2 つのセクションでは、学習すべきさまざまなモデルについて説明します。そのトレーニング方法を説明します

このアプローチの協調的な性質は、モデルが新しい特徴量を支援します。映画のエンベディングベクトルが固定されているとします。次に、このモデルは、ユーザーが最も適切に説明するためのエンベディングベクトルを学習できます。できます。その結果、好みが似ているユーザーのエンべディングは近い値になります。同様に、ユーザーのエンベディングが固定されている場合、フィードバックマトリックスを最もよく説明する映画のエンべディングを学習します。その結果、類似ユーザーが高く評価した映画のエンベディングが学習します。

理解度をチェックする

モデルがユーザーにショッピングアプリをおすすめしたのは、最近のことが理由です。ユーザーが同様のアプリをインストールしました。これはどのようなフィルタリングの例ですか。

コンテンツベースのフィルタリング

よくできました！コンテンツベースのフィルタリングでは、他のユーザーは参照されません。

コラボレーションフィルタリング

コラボレーションフィルタリングでは他のユーザーも考慮されます。 1 人のユーザーのみを考慮します

メリットとデメリット

行列分解

コラボレーション フィルタリング コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

おすすめの映画の例

1D エンベディング

2D 埋め込み

理解度をチェックする

コラボレーションフィルタリング