投资回报率先验和校准

通过投资回报率先验,可以直观地将领域知识(例如过往实验结果)纳入到模型中,以帮助指导模型训练过程。

可以根据投资回报率实验结果设置特定于渠道的投资回报率先验,Meridian 将这种方式称为“校准”。即使没有实验结果,也能利用投资回报率先验。无论有哪些数据可作为参考依据,都建议使用投资回报率先验。

投资回报率先验可确保有效系数先验的规模与每个渠道的支出相匹配。大众往往认为系数先验是更好的无信息先验,但事实并非如此。如果对所有渠道使用相同的无信息系数先验,那么实际上是在对这些渠道设置截然不同且可能相差几个数量级的投资回报率先验。

在设置投资回报率先验时,请注意以下重要事项:

  • 没有可将实验结果转换为先验的特定公式。可以将实验的点估计值和标准误差与先验平均值和标准误差保持一致(请参阅根据过往实验设置自定义先验中的示例)。不过,贝叶斯理论中先验知识的定义更为广泛,并且不需要进行公式化计算。通过将其他领域知识与实验结果相结合,可以从主观上设置先验。

  • Meridian 的默认投资回报率先验分布是对数正态分布。之所以选择此分布作为默认分布,是因为它具有两个形参,可控制平均值和标准差。不过,可以使用任何具有任意数量形参的分布来代替对数正态分布。一般来说,不建议使用投资回报率负值,因为这可能会使后验方差虚增,并导致过拟合。

  • 通过实验衡量出的投资回报率与通过营销组合建模分析 (MMM) 衡量出的投资回报率永远不会完全一致(从统计学角度来说,实验和 MMM 会得出不同的被估量。)实验结果总是与实验的特定条件相关,例如时间范围、地理位置区域、广告系列设置。从实验结果中可以获得与 MMM 得出的投资回报率高度相关的信息,但将实验结果转换为 MMM 先验不仅牵涉到实验的标准误差,还涉及到额外的不确定性因素。

  • 设置先验分布(尤其是先验标准差)时:

    • 考虑到通常需要进行一定程度的正则化来实现合适的偏差-方差权衡。虽然一些建模者可能倾向于对没有先验实验的渠道使用扁平的无信息先验,但这可能会导致过度拟合和不好的结果(偏差低但方差高)。

    • 确定合适的正则化程度可能是一个迭代过程,这包括在各种正则化强度下检查样本外模型拟合度。纯粹贝叶斯主义者可能会反对这种做法,因为后验分布无法提供明确的解释,除非先验分布精确反映了先验知识。尽管如此,这种方法对于 MMM 来说也并不一定实用。此外,获取领域知识并为模型中的每个形参设置真实先验是不切实际的,因此应该对贝叶斯推断进行相应解释。

如需了解详情,请参阅以下内容: