噪音实验室

关于本文档

通过阅读本文,您会:

  • 了解在生成摘要报告之前要创建的策略。
  • 了解 Noise Lab,这款工具可帮助了解各种噪声参数的影响,还能快速探索和评估各种噪声管理策略。
Noise Lab 的屏幕截图
Noise Lab

分享反馈

虽然本文档总结了使用摘要报告的一些原则,但还有多种噪声管理方法可能并未在此得到体现。欢迎提出建议、补充和提出问题!

  • 如需就噪声管理策略、API (epsilon) 的实用性或隐私保护发表公开反馈,以及在使用 Noise Lab 进行模拟时分享您的观察结果,请:就此问题发表评论
  • 如需就 Noise Lab 提供公开反馈(提问、报告 bug、请求功能),请在此处创建新问题
  • 如需就 API 的其他方面发表公开反馈,请在此处创建新问题

前期准备

  1. 如需了解相关说明,请参阅 Attribution Reporting:摘要报告Attribution Reporting 完整系统概览
  2. 如需充分利用本指南,请浏览了解噪声了解汇总键

设计决策

核心设计原则

第三方 Cookie 和摘要报告的运作方式存在根本性差异。一个主要区别是摘要报告中测量数据中添加了噪声。另一个是定期生成报告的方式。

若要访问具有更高信噪比的汇总报告测量数据,需求方平台 (DSP) 和广告衡量服务提供商将需要与其广告主合作,共同制定噪声管理策略。为了制定这些策略,DSP 和衡量服务提供商需要做出设计决策。这些决定围绕一个基本概念:

虽然分布噪声值完全取决于两个参数 ⏤epsilon 和贡献预算⏤,您可以自由选择许多其他控制项,这会影响输出测量数据的信噪比

虽然我们预计迭代过程会给出最佳决策,但这些决策的每个变化都会导致实现略有不同,因此必须在编写每次代码迭代之前(以及投放广告之前)做出这些决策。

决策:维度粒度

在 Noise Lab 中试用

  1. 进入“高级”模式。
  2. 在“参数”侧边栏中找到您的转化数据。
  3. 观察默认参数。默认情况下,每日的可归因转化次数总计为 1000 次。如果使用默认设置(默认维度、每个维度可能不同值的默认数量、键策略 A),则每个存储分区的平均值大约为 40。您会发现输入的“每个存储分区的平均每日可归因转化次数”的值为 40。
  4. 点击“模拟”可使用默认参数运行模拟。
  5. 在“参数”侧边栏中找到“维度”。将地理位置重命名为城市,并将可能的不同值的数量更改为 50。
  6. 观察这会如何改变每个存储分区的每日可归因转化次数。现在低了很多。这是因为,如果您增加此维度中可能值的数量,而没有更改任何其他内容,则会增加存储分区的总数,而又不会改变归入每个存储分区的转化事件数量。
  7. 点击“模拟”。
  8. 观察生成的模拟的噪声比:现在的噪声比高于先前的模拟。

根据核心设计原则,摘要值较小可能比汇总值较大可能更嘈杂。因此,您的配置选择会影响每个分桶中最终归因的转化事件数量(也称为汇总键),而该数量会影响最终输出摘要报告中的噪声。

维度粒度是一个会影响单个存储分区中归因转化事件数量的设计决策。请参考以下汇总键及其维度示例:

  • 方法 1:使用一个粗略维度的键结构:国家/地区 x 广告系列(或最大的广告系列汇总范围)x 产品类型(从 10 种可能的产品类型中选出)
  • 方法 2:使用一个具有精细维度的键结构:城市 x 广告素材 ID x 产品(共 100 个可能的产品)

“城市”是比“国家/地区”更精细的维度;“广告素材 ID”比“广告系列”更精细,“产品”比“产品类型”更精细。因此,与方法 1 相比,方法 2 在其摘要报告输出中每个存储分区的事件(转化)数量(每个键对应的事件数)较少。由于添加到输出中的噪声与分桶中的事件数量无关,因此使用方法 2 时,摘要报告中的测量数据会比较嘈杂。对于每个广告主,请在密钥设计中权衡各种粒度权衡,以便在结果中获得最大效用。

决策:关键结构

在 Noise Lab 中试用

在简单模式下,系统会使用默认的键结构。在高级模式下,您可以尝试使用不同的按键结构。这里提供了一些维度示例,您也可以进行修改。

  1. 进入“高级”模式。
  2. 在“参数”侧边栏中,找到“键策略”。请注意,该工具中名为“A”的默认策略使用一个包含所有维度的精细键结构:地理位置 x 广告系列 ID x 产品类别。
  3. 点击“模拟”。
  4. 观察产生的模拟的噪声比。
  5. 将“键”策略更改为 B。系统会显示其他控件,供您配置密钥结构。
  6. 配置您的键结构,例如:
    1. 按键结构的数量:2
    2. 键结构 1 = 地理位置 x 产品类别。
    3. 键结构 2 = 广告系列 ID x 产品类别。
  7. 点击“模拟”。
  8. 您会发现,如果您使用两种不同的键结构,现在每种衡量目标类型都会生成 2 份摘要报告(2 份针对购买次数,2 份针对购买价值)。观察它们的噪声比。
  9. 您还可以尝试使用自己的自定义维度执行此操作。为此,请找到要跟踪的数据:“维度”。请考虑移除示例维度,并使用最后一个维度下方的“添加/移除/重置”按钮创建您自己的维度。

另一个设计决策会影响单个存储分区中归因转化事件的数量,那就是您决定使用的键结构。请考虑以下汇总键示例:

  • 一个键结构包含所有维度;我们称之为“关键策略 A”。
  • 两个键结构,每个结构都有一个维度子集;我们称之为“关键策略 B”。
图表:

策略 A 更简单,但您可能需要汇总(汇总)包含摘要报告的噪声摘要值,才能访问某些数据分析。对这些值求和,也可以对噪声进行求和。采用策略 B 时,摘要报告中显示的摘要值可能已为您提供所需的信息。这意味着,与策略 A 相比,策略 B 可能会带来更高的信噪比。不过,策略 A 中的噪声可能已经可以接受,因此为简单起见,您仍然可以决定优先采用策略 A。 如需了解详情,请参阅简要说明这两种策略的详细示例

密钥管理是一个深层次的话题。您可以考虑采用多种复杂技术来提高信噪比。高级密钥管理中介绍了一种方式。

决策:批处理频率

在 Noise Lab 中试用

  1. 进入简单模式(或高级模式 - 就批处理频率而言,这两种模式的工作方式相同)
  2. 在“参数”侧边栏中,找到“您的汇总策略”>“批处理频率”。这是指在单个作业中使用汇总服务处理的可汇总报告的批处理频率。
  3. 观察默认批处理频率:默认情况下,系统会模拟每日批处理频率。
  4. 点击“模拟”。
  5. 观察产生的模拟的噪声比。
  6. 将批处理频率更改为每周一次。
  7. 观察生成的模拟的噪声比:现在的噪声比比上一个模拟低(更好)。

另一个会影响单个存储分区中归因转化事件数量的设计决策是您决定使用的批处理频率。批处理频率是指您处理可汇总报告的频率。

与汇总频率较低的报告(例如每周)相比,安排更频繁地汇总(例如每小时)的报告所包含的转化事件会较少。因此,每小时报告将包含更多噪声。```与同一报告相比,包含的转化事件较少,汇总频率较低(例如每周)。因此,在所有其他条件相同的情况下,每小时报告的信噪比要低于每周报告。对不同频率的报告要求进行实验,并评估每种频率的信噪比。

如需了解详情,请参阅批处理在较长的时间段内进行汇总

决策:影响可归因转化的广告系列变量

在 Noise Lab 中试用

虽然这种情况很难预测,而且除了季节性影响之外,还会产生很大的变化,但请尝试估算每天的可归因为单接触点的转化次数,即 10、100、1000 或 10,000 的最接近的次方数。

  1. 进入“高级”模式。
  2. 在“参数”侧边栏中找到您的转化数据。
  3. 观察默认参数。默认情况下,每日的可归因转化次数总计为 1000 次。如果使用默认设置(默认维度、每个维度可能不同值的默认数量、键策略 A),则每个存储分区的平均值大约为 40。您会发现输入的“每个存储分区的平均每日可归因转化次数”的值为 40。
  4. 点击“模拟”可使用默认参数运行模拟。
  5. 观察产生的模拟的噪声比。
  6. 现在,将每日可归因转化总数设置为 100 次。 您会发现,这会降低每个存储分区的每日可归因转化次数的值。
  7. 点击“模拟”。
  8. 您会发现噪声比现在更高了:这是因为当每个存储分区的转化次数减少时,系统会应用更多噪声以保护隐私。

一个重要区别在于广告客户可能获得的总转化次数与可能的归因总转化次数。后者是最终影响摘要报告中的噪声的原因。“已归因的转化次数”是总转化次数的一部分,通常含有广告系列变量,例如广告预算和广告定位。例如,在所有其他条件均相同的情况下,您预计金额为 1,000 万美元的广告系列会获得更高的归因转化次数。

需要考虑的事项:

  • 根据同一种设备归因模型来评估已归因的转化,因为这些模型在通过 Attribution Reporting API 收集的摘要报告范围内。
  • 对于归因转化,请同时考虑最坏情况计数和最佳情况计数。例如,在所有其他条件相同的情况下,考虑广告主可能的最低和最高广告系列预算,然后预测可归因这两种结果的转化,将其作为模拟的输入。
  • 如果您考虑使用 Android Privacy Sandbox,请在计算时考虑跨平台归因转化。

决策:使用扩缩

在 Noise Lab 中试用

  1. 进入“高级”模式。
  2. 在“参数”侧边栏中,找到“您的汇总策略”>“扩缩”。此属性默认设置为“是”。
  3. 如需了解缩放对噪声比率的积极影响,请先将“缩放”设置为“否”。
  4. 点击“模拟”。
  5. 观察产生的模拟的噪声比。
  6. 将“扩缩”设置为“是”。请注意,Noise Lab 会根据您的场景,根据测量目标的范围(平均值和最大值),自动计算要使用的缩放比例。在实际的系统或源试用设置中,您需要实现自己的缩放比例计算功能。
  7. 点击“模拟”。
  8. 您会发现,在第二次模拟中,噪声比现在更低(更好)。这是因为您正在使用扩缩功能。

根据核心设计原则,增加的噪声是贡献预算的函数。

因此,为了提高信噪比,您可以决定对在转化事件期间收集的值进行转换,方法是根据贡献预算调整这些值(并在汇总后取消调整)。使用缩放提高信噪比。

决策:衡量目标数量和隐私预算分配

这与扩缩相关;请务必阅读使用扩缩

在 Noise Lab 中试用

衡量目标是在转化事件中收集的独特数据点。

  1. 进入“高级”模式。
  2. 在“参数”侧边栏中,查找要跟踪的数据:衡量目标。默认情况下,您有两个衡量目标:购买价值和购买次数。
  3. 点击“模拟”可使用默认目标运行模拟。
  4. 点击“移除”。这将移除最后一个衡量目标(在这种情况下为购买次数)。
  5. 点击“模拟”。
  6. 您会发现,对于第二次模拟,购买价值的噪声比率现在更低(更好)。这是因为您的衡量目标较少,您的一个衡量目标现在获得了所有贡献预算。
  7. 点击“重置”。现在,您同样有两个衡量目标:购买价值和购买次数。请注意,Noise Lab 会根据您的场景,根据测量目标的范围(平均值和最大值),自动计算要使用的缩放比例。默认情况下,Noise Lab 会在各个测量目标之间平均分配预算。
  8. 点击“模拟”。
  9. 观察产生的模拟的噪声比。记下模拟上显示的缩放比例。
  10. 现在,我们来自定义隐私预算分配,以实现更好的信噪比。
  11. 调整为每个衡量目标指定的预算百分比。假设有默认参数,衡量目标 1(即购买价值)比衡量目标 2(即购买次数)的范围(0 到 1000 之间)要宽得多(介于 1 到 1 之间,即始终等于 1)。因此,需要“更多扩展空间”:最好为衡量目标 1 分配比衡量目标 2 更多的贡献预算,以便更高效地扩大规模(请参阅“扩缩”),因此
  12. 将 70% 的预算分配给衡量目标 1。为衡量目标 2 指定 30%。
  13. 点击“模拟”。
  14. 观察产生的模拟的噪声比。对于购买价值,噪声比现在明显低于(优于)上一次模拟。购买交易数量大致不变。
  15. 不断调整针对各项指标的预算分配比例。观察这对噪声的影响。

请注意,您可以使用“添加/移除/重置”按钮设置自己的自定义衡量目标。


如果您衡量转化事件中的一个数据点(衡量目标),例如转化次数,则该数据点可以获得所有贡献预算 (65536)。如果您为转化事件设置了多个衡量目标(例如转化次数和购买价值),则这些数据点需要共享贡献预算。这意味着您没有足够的余地来扩大价值。

因此,您的测量目标越多,信噪比越低(噪声越高)。

关于衡量目标,需要做出的另一个决策是预算分配。如果您将贡献预算平均分配给两个数据点,则每个数据点的预算为 65536/2 = 32768。这可能是最佳选择,也可能不是最佳选择,具体取决于每个数据点可能的最大值。例如,如果您要测量的购买次数最大值为 1,而购买价值最小值为 1 且最大值为 120,那么“更多空间”将有助于提升购买价值,也就是分配更大比例的捐赠预算。您将了解到,就噪声的影响而言,某些测量目标是否应优先于其他测量目标。

决策:离群值管理

在 Noise Lab 中试用

衡量目标是在转化事件中收集的独特数据点。

  1. 进入“高级”模式。
  2. 在“参数”侧边栏中,找到“您的汇总策略”>“扩缩”。
  3. 确保“扩缩”设置为“是”。请注意,Noise Lab 会根据您为测量目标指定的范围(平均值和最大值)自动计算要使用的缩放比例。
  4. 假设有史以来最大金额的购买金额为 2, 000 美元,但大多数购买金额都在 10 美元到 120 美元之间。首先,我们看看如果使用字面调整方法(不推荐)会发生什么情况:输入 $2000 作为 purchaseValue 的最大值。
  5. 点击“模拟”。
  6. 发现噪声比较高。这是因为我们的缩放比例目前是基于 $2, 000 计算的,而实际上大多数购买价值明显低于该值。
  7. 现在,我们来使用一种更实用的扩缩方法。将最高购买价值更改为 120 美元。
  8. 点击“模拟”。
  9. 观察发现,在第二次模拟中,噪声比较低(更好)。

如需实现调整比例,您通常需要根据给定转化事件可能的最大价值计算调整系数(在本示例中了解详情)。

但是,请避免使用字面最大值来计算该缩放比例,因为这会导致信噪比变差。相反,您应该移除离群值,并使用实用的最大值。

离群值管理是一个深层主题。您可以考虑采用多种复杂技术来提高信噪比。高级离群值管理中介绍了一种情况。

后续步骤

现在,您已经为您的用例评估了各种噪声管理策略,接下来,您可以通过源试用收集真实的衡量数据,开始对摘要报告进行实验。查看有关试用 API 的指南和提示。

附录

Noise Lab 快速导览

Noise Lab 可帮助您快速评估和比较噪声管理策略。自由形式探索可用于:

  • 了解可能影响噪声的主要参数及其影响。
  • 根据不同的设计决策,模拟噪声对输出测量数据的影响。微调设计参数,直到达到适合您使用场景的信噪比。
  • 请就摘要报告实用性的反馈提供反馈:哪些 epsilon 和噪声参数适合您,哪些没有?拐点在哪里?

可以将其视为准备步骤。Noise Lab 会根据您的输入生成测量数据,以模拟摘要报告输出。而不会保留或共享任何数据。

Noise Lab 有两种不同的模式:

  1. 简单模式:了解噪声控制方面的基础知识。
  2. 高级模式:测试不同的噪声管理策略,并评估哪种策略可以为您的使用场景带来最佳的信噪比。

点击顶部菜单中的按钮,在两种模式之间切换(下方屏幕截图中的第 1 点)。

简单模式
  • 在简单模式下,您可以控制参数(位于左侧,或下方屏幕截图中的第 2 点),例如 Epsilon,并查看这些参数对噪声的影响。
  • 每个参数都有一个提示(“?”按钮)。点击这些参数可查看每个参数的说明(下方屏幕截图中的#3
  • 首先,点击“Simulate”按钮,然后观察输出结果(下方屏幕截图中的#4
  • 在“输出”部分,您可以看到各种详细信息。某些元素的旁边有一个 `?`。请花点时间点击每个 `?`,以查看对各项信息的说明。
  • 如果您想要查看表格的展开版本,请点击“Output”(输出)部分中的“Details”(详细信息)切换开关(下方屏幕截图中的#5
  • 在输出部分的每个数据表下方,有一个用于下载该表以供离线使用的选项。此外,您还可以通过右下角的选项下载所有数据表(下方屏幕截图中的 6.
  • 在“参数”部分中测试参数的不同设置,然后点击“模拟”可查看它们对输出有何影响:
    噪音
    简单模式的 Noise Lab 界面。
高级模式
  • 在高级模式下,您可以更好地控制参数。您可以添加自定义衡量目标和维度(下方屏幕截图中的第 1 条和第 2 条
  • 在“参数”部分进一步向下滚动,然后查看“关键策略”选项。这可用于测试不同的键结构(下方屏幕截图中的第 3 点
    • 要测试不同的关键结构,请将关键策略切换为“B”
    • 输入您要使用的不同按键结构的数量(默认设置为“2”)
    • 点击“Generate Key Structures”(生成关键结构)
    • 您将看到用来指定键结构的选项,只需点击要为每个键结构添加的键旁边的复选框即可
    • 点击“模拟”可查看输出结果。
      高级模式提供了各种控件,可用于控制效果衡量目标和要跟踪的维度,已在边栏中突出显示。
      高级模式的 Noise Lab 界面。
      高级模式也是边栏的“参数”部分中的“关键策略”选项。
      高级模式的 Noise Lab 界面。

噪声指标

核心概念

添加了噪声以保护个人用户隐私。

高噪声值表示桶/键很稀疏,并且包含来自有限数量的敏感事件的贡献。Noise Lab 会自动执行此操作,让个人可以“隐藏在人群中”,换句话说,它通过添加大量额外的噪声来保护这些限定人员的隐私。

低噪声值表示数据设置的设计方式已允许个人“隐藏在人群中”。这意味着,分桶包含来自足够数量的事件的贡献,以确保个人用户隐私得到保护。

此说法适用于平均百分比误差 (APE) 和 RMSRE_T(带阈值的均方根相对误差)。

APE(平均百分比误差)

APE 是噪声与信号的比率,即实际汇总值。p> 更低的 APE 值意味着更好的信噪比。

公式

对于指定的摘要报告,APE 的计算方式如下:

APE 的方程式。必须提供绝对值,因为噪声可能是负数。

True 是真正的汇总值。APE 是每个真实摘要值对应的噪声平均值,针对摘要报告中的所有条目取平均值。在 Noise Lab 中,将此结果乘以 100,得到一个百分比。

优缺点

尺寸较小的存储分区对 APE 最终值的影响过大。在评估噪声时,这可能具有误导性。因此,我们添加了另一个指标 RMSRE_T,旨在减轻 APE 的这一限制。如需了解详情,请查看示例

代码

查看用于 APE 计算的源代码

RMSRE_T(带阈值的均方根相对误差)

另一种衡量噪声的方法是 RMSRE_T(带阈值的均方根相对误差)。

如何解读 RMSRE_T

RMSRE_T 值越低,信噪比越高。
例如,如果为您的用例接受的噪声比为 20% 且 RMSRE_T 为 0.2,您就可以确信噪声等级在可接受的范围内。

公式

对于给定的摘要报告,RMSRE_T 的计算公式如下:

公式
RMSRE_T 的方程式。必须提供绝对值,因为噪声可能是负数。
优缺点

理解 RMSRE_T 比 APE 略复杂。不过,它具有一些优势,因此在某些情况下比 APE 更适合用来分析摘要报告中的噪声:

  • RMSRE_T 更稳定。“T”是一个阈值。“T”用于在 RMSRE_T 计算中为转化次数较少的存储分区分配较小的权重,因为这些存储分区因规模较小而对噪声更敏感。在 T 级别,该指标不会在转化较少的存储分区中出现峰值。如果 T 等于 5,则在转化次数为 0 的存储分区上小至 1 的噪声值不会显示为大于 1 的值。而是将上限设置为 0.2(等于 1/5),因为 T 等于 5。通过为更小的存储分区分配权重,这些存储分区对噪声更敏感,该指标更加稳定,因此可以更轻松地比较两个模拟。
  • 通过 RMSRE_T 可轻松汇总。了解多个存储分区的 RMSRE_T 及其真实计数,您就可以计算总和的 RMSRE_T。这样,您也可以针对这些组合值优化 RMSRE_T。

虽然 APE 可以进行汇总,但该公式非常复杂,因为它涉及拉普拉斯噪声总和的绝对值。这使得 APE 更难优化。

代码

查看用于计算 RMSRE_T 的源代码

示例

包含三个大类的摘要报告:

  • bucket_1 = 噪声:10,trueSummaryValue:100
  • bucket_2 = 噪声:20,trueSummaryValue:100
  • bucket_3 = 噪声:20,trueSummaryValue:200

APE = (0.1 + 0.2 + 0.1) / 3 = 13%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14 

包含 3 个大类的摘要报告:

  • bucket_1 = 噪声:10,trueSummaryValue:100
  • bucket_2 = 噪声:20,trueSummaryValue:100
  • bucket_3 = 噪声:20,trueSummaryValue:20

APE = (0.1 + 0.2 + 1) / 3 = 43%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

包含 3 个大类的摘要报告:

  • bucket_1 = 噪声:10,trueSummaryValue:100
  • bucket_2 = 噪声:20,trueSummaryValue:100
  • bucket_3 = 噪声:20,trueSummaryValue:0

APE = (0.1 + 0.2 + 无穷大) / 3 = 无穷大

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

高级密钥管理

一家 DSP 或广告衡量公司可能拥有数以千计的全球广告客户,客户遍布多个行业、币种和购买价格潜力。这意味着,为每个广告客户创建和管理一个汇总键可能是非常不切实际的。此外,选择可汇总值上限和汇总预算也很困难,这些预算可以限制噪声对全球数千个广告客户的影响。相反,我们考虑以下场景:

关键策略 A

广告技术提供商决定为所有广告客户创建和管理一个密钥。对于所有广告主和所有币种,购买范围各不相同,从低量的高端购买到高量的低端购买。这会生成以下键:

键(多种货币)
可汇总的最大值 5000000
购买价值范围 [120 - 5000000]
关键策略 B

广告技术提供商决定为其所有广告客户创建和管理两个密钥。他们决定按币种划分键。对于所有广告主和所有币种,购买范围都不相同,从低量的高端购买到高量的低端购买。按货币区分,他们会创建 2 个键:

键 1 (USD) 键 2 (¥)
可汇总的最大值 $40000 5,000,000 日元
购买价值范围 [120 - 40,000] [15,000 - 5,000,000]

与关键策略 A 相比,密钥策略 B 的结果噪声更少,因为币种价值在币种之间不均匀分布。例如,考虑以日元计价的购买交易与以美元计价的购买交易将如何改变基础数据,并导致输出为噪声。

关键策略 C

广告技术提供商决定为其所有广告客户创建和管理四个密钥,并按币种 x 广告客户行业将它们分开:

密钥 1
(美元 x 高端珠宝广告客户)
密钥 2
(¥ x 高端珠宝广告客户)
键 3
(美元 x 服装零售商广告客户)
键 4
(¥ x 服装零售商广告客户)
可汇总的最大值 $40000 5,000,000 日元 $500 65,000 日元
购买价值范围 [10,000 - 40,000] [1250000 - 5000000] [120 - 500] [15,000 - 65,000]

与关键策略 B 相比,关键策略 C 的噪声较少,因为广告客户的购买价值在广告客户之间并非均匀分布。例如,考虑将购买高端珠宝与购买棒球帽将如何改变底层数据,并导致输出噪声。

考虑为多个广告主的共同点创建共享的最大汇总值和共享扩缩系数,以减少输出中的噪声。例如,您可以为广告主试验以下不同的策略:

  • 一种按币种(美元、¥、加元等)划分的策略
  • 按广告主行业(保险、汽车、零售等)分别制定一项策略
  • 一个策略,按相似的购买价值范围([100]、[1000]、[10000] 等)分隔

通过围绕广告主的共性创建关键策略,键和相应的代码更易于管理,信噪比也更高。对具有不同广告主共性的不同策略进行实验,以发现最大限度提高噪声影响与代码管理之间的拐点。


高级离群值管理

让我们以两个广告客户为例进行说明:

  • 广告客户 A:
    • 就广告客户 A 网站上的所有产品而言,可能的购买价格介于 [$120 - $1,000] 之间,范围为 $880。
    • 购买价格在 880 美元范围内均匀分布,在购买价格中位数的两个标准差之外没有离群值。
  • 广告客户 B:
    • 就广告客户 B 网站上的所有产品而言,可能的购买价格介于 [$120 - $1,000] 之间,范围为 $880。
    • 购买价格大幅偏离 $120 - $500 范围,只有 5% 的购买交易发生在 $500 - $1,000 范围内。

鉴于贡献预算要求以及将 [应用噪声](/privacy-sandbox/relevance/attribution-reporting/understanding-noise/#how-noise-is-applied)的方法应用于最终结果,默认情况下,广告客户 B 的输出的噪声比广告客户 A 更多,因为广告客户 B 更有可能对离群值造成影响。

可以通过特定的密钥设置缓解此问题。测试有助于管理离群数据以及更均匀地跨键的购买范围分配购买价值的关键策略。

对于广告客户 B,您可以创建两个单独的键来捕获两个不同的购买价值范围。在此示例中,广告技术平台注意到 500 美元购买价值上方存在离群值。尝试为此广告主实现两个单独的键:

  • 密钥结构 1:仅捕获 120 美元到 500 美元范围内的购买(约占总交易量的 95%)的密钥。
  • 关键结构 2:仅捕获超过 $500 的购买交易(约占总交易量的 5%)的密钥。

实施这项关键策略应该能更好地管理广告主 B 的噪声,并有助于最大限度地发挥摘要报告中的效用。鉴于新的较小范围,键 A 和键 B 现在在各个键之间的数据分布应该比上一个单个键更均匀。与上一个单个密钥相比,这会减少每个密钥输出对噪声的影响。