このページは Cloud Translation API によって翻訳されました。

取得

エンベディングモデルがあるとします。ユーザーが特定された場合、どのアイテムをおすすめするかをどのように決定しますか。

サービング時に、あるクエリを指定して、まず次のいずれかを行います。

クエリエンベディング \(q\)を取得したら、エンベディング空間で \(q\) に近いアイテムエンベディング\(V_j\) を検索します。これは最近傍問題です。たとえば、類似性スコア \(s(q, V_j)\)に基づいて上位 k 個のアイテムを返すことができます。

子供向けから大人向け、アートハウスから大ヒット作まで、複数の映画とユーザーが配置された 2 次元スペクトルの画像。1 人のユーザーと、近くにある 2 本の映画がハイライト表示されています。

関連アイテムのおすすめにも同様のアプローチを使用できます。たとえば、ユーザーが YouTube 動画を視聴している場合、システムはまずそのアイテムのエンベディングを検索し、エンベディング空間で近い他のアイテムのエンベディングを検索します。\(V_j\)

大規模な取得

エンベディング空間内の最近傍を計算するために、システムはすべての候補を徹底的にスコア付けします。非常に大規模なコーパスでは、網羅的なスコアリングは費用がかかる場合がありますが、次のいずれかの戦略を使用して効率を高めることができます。

クエリエンベディングが静的にわかっている場合は、システムはオフラインで網羅的なスコアリングを実行し、各クエリの上位候補のリストを事前計算して保存できます。これは、関連アイテムのレコメンデーションでよく行われる手法です。
近似最近傍を使用する。 Google は、GitHub で ScaNN（Scalable Nearest Neighbors）というオープンソースツールを提供しています。このツールは、大規模なベクトル類似性検索を効率的に実行します。