このページは Cloud Translation API によって翻訳されました。

エンベディング: コラボレーションフィルタリングの動機

協調フィルタリングは、他の多くのユーザーの関心に基づいてユーザーの興味や関心を予測する機能です。映画のレコメンデーションタスクの例を見てみましょう。たとえば、50 万人のユーザーが、（1,000,000 本の映画のカタログから）視聴した映画のリストがあるとします。YouTube は、ユーザーに映画をおすすめすることを目標としています。

この問題を解決するには、どの映画が互いに類似しているかを判断する方法が必要です。これを実現するには、類似の映画が近くにあるように作成された低次元スペースに映画を埋め込みます。

エンベディングの学習方法を説明する前に、エンベディングに必要な品質の種類と、エンベディングの学習に使用するトレーニングデータをどのように表現するかを説明します。

映画を 1 次元数の線に配置する

エンベディング（埋め込み）についての直感的な判断を助けるため、以下の映画をできる限り 1 次元の数字ラインに並べるようにしましょう。

映画	評価	説明
ブルー	（右）	フランスの夫が夫と娘を亡くし、交通事故で死亡しました。
ダークナイトライジング	PG-13	バットマンは、DC コミックの世界を舞台にしたダークナイトに続いて、ゴッサムシティを原神の滅亡から救うために努力します。
ハリーポッターと賢者の石	PG	孤立した少年は魔法使いであることを知り、ホグワーツ学校魔法と魔法学校に入学します。そこで彼は邪悪なヴォルデモート王との初戦を繰り広げます。
インクレディブル	PG	郊外の民間人を退職させ、シンドロームとその殺人ロボットをめぐるスーパーヒーローを救うために、スーパーヒーローたちの家族を追う。
シュレック	PG	愛すべき鬼とロバの副業は、フィオナ王女を救うためにドラゴンに囲まれて城を守ります。
スターウォーズ	PG	ルークスカイウォーカーとハンソロは、2 つの Android でレイア女王を救出して銀河を救いました。
ベルヴィル・ランデブー	PG-13	フランスのプロサイクリストがツールドフランスで誘拐されたとき、3 人の高齢ジャズ歌手の手を借りて、祖母と海外で重厚な犬を連れて救い出しました。
メメント	（右）	羊飼いは、妻の殺害に絶好の策を講じようとしています。

プラスアイコン（非常に不完全なもの）をクリックし、

図 1. 可能な 1 次元の配置

エンベディングは、子供と大人向けの映画の内容の把握に役立ちますが、提案を行う際に映画の多くの側面をキャプチャしたい場合もあります。この例をさらに一歩進めて、2 つ目の埋め込みディメンションを追加しましょう。

映画を 2 次元空間に配置

前と同じ演習を試しますが、今回は同じ映画を 2 次元空間に配置します。

別のアイコンをクリックして、可能な解決策を見つけます。

図 2. 可能な 2 次元の配置

この 2 次元エンベディングでは、映画と映画のどちらに近い範囲で映画が近くにあるか（つまり、類似する映画と推定される程度）、大ヒット映画とアート系映画がどの程度の距離にあるかという距離を定義します。もちろんこれらは、重要な映画の多くの特性のうちの 2 つにすぎません。

より一般的な例としては、こうした映画をエンベディング空間にマッピングし、各単語を 2 次元の座標セットで記述しています。たとえば、このスペースの「Shrek」は（-1.0、0.95）にマッピングされ、「Bleu」は（0.65、-0.2）にマッピングされます。一般に、d 次元のエンベディングを学習する場合、各映画は d の実数値で表され、それぞれが 1 次元の座標になります。

この例では、各ディメンションの名前を指定しています。エンベディングを学習する場合、個々のディメンションは名前で学習されません。エンベディングを調べて、次元に意味の意味を割り当てる場合もあれば、できない場合もあります。このようなディメンションは多くの場合、潜在ディメンションと呼ばれます。これは、データでは明示されていないが、データから推測される特徴を表すためです。

最終的には、特定の次元に沿った 1 つの映画の値ではなく、エンベディング空間内の映画間の距離が意味を持ちます。

ヘルプセンター

動画講義

カテゴリ入力データ