评分

生成候选集后,另一个模型会对生成的候选网络进行评分和排名,以选择要显示的一组项。推荐系统可能有多个使用不同来源的候选生成器,例如:

示例
  • 矩阵分解模型中的相关项。
  • 考虑个性化的用户功能。
  • “本地”与“远距离”项;也就是说,考虑地理信息。
  • 热门商品或潮流商品。
  • 社交图谱,即朋友喜欢或推荐的商品。

系统会将这些不同来源合并成一个共同的候选池,然后由单个模型进行评分,并根据该得分进行排名。例如,系统可训练模型来预测用户在 YouTube 上观看视频的概率,前提是符合以下条件:

  • 查询功能(例如,用户的观看记录、语言、国家/地区、时间)
  • 视频功能(例如标题、标签、视频嵌入)

然后,系统可以根据模型的预测对候选池中的视频进行排名。

何不让候选生成器得分?

由于候选生成器会生成分数(例如嵌入空间中的相似度测量),因此您可能很想用它们进行排名。不过,您应出于以下原因避免这种做法:

  • 有些系统依赖于多个候选生成器。这些不同生成器的得分可能没有可比性。
  • 由于候选池较少,系统能够使用更多功能和更复杂的模型,这些模型可以更好地捕获上下文。

选择客观函数进行评分

您可能记得在机器学习问题构建简介中,机器学习可以像恶作剧的天才一样:非常了解您所提供的目标,但您必须留心实现目标。这种不当的质量也适用于推荐系统。评分功能选择会显著影响商品的排名,并最终影响商品推荐的质量。

示例

点击加号图标可了解使用各个目标所产生的影响。

Google Play 商店首页的图片,其中突出显示了新的游戏和更新过的游戏以及推荐的应用。

得分调整中的位置偏差

相较于在屏幕靠高的项目,在屏幕靠低的项上点击的可能性要低。但是,对视频进行评分时,系统通常不知道视频的链接最终会显示在屏幕的哪个位置。查询具有所有可能位置的模型费用太高。即使查询多个位置可行,系统可能仍然无法在多个排名分数中找到一致的排名。

解决方案

  • 创建与排名无关的排名。
  • 将所有候选视频都视为位于屏幕上的最高排名。