レコメンデーション システムの一般的なアーキテクチャの 1 つは、次のコンポーネントで構成されています。
- 候補者の発掘
- スコアリング
- 再ランキング
候補者の発掘
この最初の段階では、システムが巨大なコーパスから開始し、はるかに小さな候補のサブセットが生成されます。たとえば、YouTube の候補生成ツールを使用すると、数十億本の動画を数百から数千にまで削減できます。このモデルでは、コーパスの巨大なサイズを考慮して、クエリを迅速に評価する必要があります。特定のモデルは複数の候補生成ツールを提供し、それぞれがそれぞれ異なる候補のサブセットを指定できます。
スコア付け
次に、別のモデルは候補をスコア付けしてランク付けし、ユーザーに表示するアイテムのセット(10 程度程度)を選択します。このモデルはアイテムの小さなサブセットを評価するため、システムは追加のクエリに依存するより正確なモデルを使用できます。
再ランキング
最後に、最終的なランキングのための追加の制約を考慮する必要があります。たとえば、ユーザーが明示的に嫌いだったアイテムを削除したり、新しいコンテンツのスコアを上げたりします。再ランキングは、ダイバーシティ、鮮度、公平性の確保にもつながります。
これらの各段階について、クラス全体で学習し、YouTube などさまざまなレコメンデーション システムから例を示します。