推荐系统概览

推荐系统的一种常见架构由以下组件组成:

  • 候选人生成
  • 评分
  • 重新排名

推荐系统的组件以及每个阶段的规模图示。

候选生成

在此第一阶段中,系统从潜在的大语料库开始,生成一小部分候选对象。例如,YouTube 中的候选人生成器可将数十亿个视频缩减为数百或数千个。由于语料库规模庞大,模型需要快速评估查询。给定模型可能会提供多个候选生成器,每个候选生成器推荐不同的候选子集。

记分

接下来,另一个模型会对候选数据集进行评分和排名,以便选择要向用户显示的一组项(按 10 的顺序排列)。由于此模型评估的是相对较小的项子集,因此系统可以使用依赖于其他查询的更精确的模型。

重新排名

最后,系统必须考虑最终排名的其他限制条件。例如,系统会移除用户明确不喜欢的内容,或提高新内容的得分。重新排名也有助于确保多样性、新鲜度和公平性。

我们会在本课程中讨论每个阶段,并给出来自不同推荐系统(如 YouTube)的示例。