Работа с шумом

Узнайте, как работать с шумом, учитывать его и уменьшать влияние шума в сводных отчетах.

Прежде чем вы начнете

Прежде чем продолжить, для более глубокого понимания того, что такое шум и его влияние, обратитесь к разделу «Понимание шума в сводных отчетах» .

Ваш контроль над шумом

Хотя вы не можете напрямую контролировать шум, добавляемый в ваши агрегированные отчеты, есть шаги, которые вы можете предпринять, чтобы минимизировать этот эффект. В следующих разделах объясняются эти стратегии.

Масштабирование до бюджета взносов

Как поясняется в разделе «Понимание шума», шум, применяемый к сводному значению для каждого ключа, основан на шкале от 0 до 65 536 (0- CONTRIBUTION_BUDGET ).

Распределение шума зависит от бюджета.

В связи с этим, чтобы максимизировать сигнал по отношению к шуму, вам следует масштабировать каждое значение, прежде чем устанавливать его как агрегируемое значение, то есть умножать каждое значение на определенный коэффициент, коэффициент масштабирования , гарантируя при этом, что оно остается в пределах бюджета вклада.

Относительный шум с масштабированием и без него.

Вычисление коэффициента масштабирования

Коэффициент масштабирования показывает, насколько вы хотите масштабировать данное агрегируемое значение. Его значение должно быть бюджетом вклада, разделенным на максимальное совокупное значение для определенного ключа.

Определение коэффициента масштабирования на основе бюджета взносов.

Например, предположим, что рекламодатели хотят знать общую стоимость покупки. Вы знаете, что максимальная ожидаемая стоимость любой отдельной покупки составляет 2000 долларов США, за исключением нескольких отклонений, которые вы решаете игнорировать:

  • Рассчитаем коэффициент масштабирования :
    • Чтобы максимизировать соотношение сигнал/шум, вам необходимо масштабировать это значение до 65 536 (бюджет вклада).
    • В результате получается 65 536/2 000, что соответствует коэффициенту масштабирования примерно 32 x . На практике вы можете округлить этот коэффициент в большую или меньшую сторону.
  • Масштабируйте значения перед агрегированием . За каждый доллар покупки увеличивайте отслеживаемый показатель на 32 . Например, для покупки на сумму 120 долларов США установите совокупное значение 120*32 = 3840.
  • Уменьшите значения после агрегирования . Как только вы получите сводный отчет, содержащий сумму покупок, суммированную для нескольких пользователей, уменьшите сводную стоимость, используя коэффициент масштабирования, который вы использовали перед агрегированием. В нашем примере мы использовали коэффициент масштабирования 32 перед агрегированием, поэтому нам нужно разделить суммарное значение, полученное в сводном отчете, на 32. Следовательно, если суммарная стоимость покупки для данного ключа в сводном отчете равна 76 800 , суммарная стоимость покупки (с шумом) равна 76 800/32 = 2 400 долларов США.

Разделите свой бюджет

Если у вас есть несколько целей измерения (например, количество и стоимость покупок), вы можете разделить свой бюджет на эти цели.

В этом случае ваши коэффициенты масштабирования будут разными для разных агрегируемых значений в зависимости от ожидаемого максимума данного агрегируемого значения.

Подробности читайте в разделе «Понимание ключей агрегирования ».

Например, предположим, что вы отслеживаете как количество покупок, так и их стоимость, и решили распределить свой бюджет поровну.

65 536 / 2 = 32 768 можно выделить для каждого типа измерения и каждого источника.

  • Количество покупок:
    • Вы отслеживаете только одну покупку, поэтому максимальное количество покупок для одной конверсии – 1.
    • Поэтому вы решаете установить коэффициент масштабирования для количества покупок равным 32 768 / 1 = 32 768.
  • Стоимость покупки:
    • Предположим, максимальная ожидаемая стоимость любой отдельной покупки составляет 2000 долларов США.
    • Поэтому вы решаете установить коэффициент масштабирования стоимости покупки равным 32 768 / 2 000 = 16,384 или примерно 16.

Более грубые ключи агрегирования улучшают соотношение сигнал/шум.

Поскольку грубые ключи улавливают больше событий преобразования, чем детальные ключи, грубые ключи обычно приводят к более высоким суммарным значениям.

Более высокие суммарные значения меньше подвержены влиянию шума, чем более низкие значения; шум этих значений, вероятно, будет ниже по сравнению с этим значением.

Значения, собранные с помощью более грубых ключей, вероятно, будут относительно менее зашумленными, чем значения, собранные с помощью более детализированных ключей.

Пример

При прочих равных условиях ключ, отслеживающий глобальную стоимость покупки (суммируемую по всем странам), приведет к более высокой суммарной стоимости покупки (и более высокому суммарному количеству конверсий), чем ключ, отслеживающий конверсии на уровне страны.

Следовательно, относительный шум общей стоимости покупок для конкретной страны будет выше, чем относительный шум общей стоимости покупок для всех стран.

Аналогичным образом, при прочих равных условиях, общая стоимость покупки обуви ниже, чем общая стоимость покупки всех товаров (включая обувь).

Следовательно, относительный шум общей стоимости покупки обуви будет выше, чем относительный шум общей стоимости покупки всех товаров.

Шумовое воздействие при использовании зернистых и грубых клавиш.

Суммирование сводных значений (свертывание) также суммирует их шум.

Суммируя сводные значения из сводных отчетов для доступа к данным более высокого уровня, вы также суммируете шум от этих сводных значений.

Степень шума при использовании гранулированных ключей со свертываниями по сравнению с грубыми клавишами без свертывания.

Давайте рассмотрим два разных подхода: - Подход А : вы включаете географический идентификатор в свои ключи. Сводные отчеты предоставляют ключи уровня географического идентификатора, каждый из которых связан со сводной стоимостью покупки на определенном уровне географического идентификатора. - Подход Б : вы не включаете географический идентификатор в свои ключи. Сводные отчеты напрямую отображают сводную стоимость покупок для всех географических идентификаторов и местоположений.

Чтобы получить доступ к стоимости покупки на уровне страны: - При использовании подхода А вы суммируете сводные значения на уровне геоидентификатора и, следовательно, также суммируете их шум. Это, вероятно, приведет к добавлению большего шума к окончательной стоимости покупки на уровне геоидентификатора. - При подходе Б вы непосредственно смотрите на данные, представленные в сводных отчетах. Шум был добавлен к этим данным только один раз.

Таким образом, итоговая стоимость покупки для данного географического идентификатора, вероятно, будет более зашумленной при подходе А.

Аналогично, включение в ключи измерения на уровне почтового индекса, скорее всего, приведет к более зашумленным результатам, чем использование более грубых ключей с измерением на уровне региона.

Агрегирование за более длительные периоды времени увеличивает соотношение сигнал/шум.

Реже запрашивая сводные отчеты, каждое сводное значение, скорее всего, будет выше, чем если бы вы запрашивали отчеты чаще; больше конверсий, скорее всего, произойдет за более длительные промежутки времени.

Как упоминалось ранее, чем выше суммарное значение, тем ниже, вероятно, будет относительный шум. Таким образом, менее частый запрос сводных отчетов приводит к более высокому (лучшему) соотношению сигнал/шум.

Менее частый запрос сводных отчетов приводит к более высокому соотношению сигнал/шум.

Вот пример для иллюстрации:

  • Если вы запрашиваете почасовые сводные отчеты за 24 часа, а затем суммируете сводные значения из каждого почасового отчета для доступа к данным на уровне дня, шум добавляется 24 раза.
  • В один ежедневный сводный отчет шум добавляется только один раз.

Выше эпсилон, ниже шум

Чем выше значение эпсилон, тем ниже шум и ниже защита конфиденциальности.

Использование фильтрации и дедупликации

Важной частью распределения бюджета между различными ключами является понимание того, сколько раз может произойти данное событие. Например, рекламодателя может интересовать только одна покупка за каждый клик, но его может интересовать до трех конверсий "Просмотр страницы продукта". Для поддержки этих вариантов использования вы также можете использовать следующие функции API, которые позволят вам контролировать, сколько отчетов создается и какие конверсии учитываются:

Экспериментируем с эпсилоном

Специалисты по рекламе могут установить для эпсилон значение от 0 до 64 включительно. Этот диапазон обеспечивает гибкое тестирование. Более низкие значения эпсилона обеспечивают большую защиту конфиденциальности. Мы рекомендуем начать с эпсилон=10.

Рекомендации по экспериментированию

Мы рекомендуем следующее: - Начните с epsilon = 10. - Если это вызывает заметные проблемы с утилитой, увеличивайте epsilon постепенно. - Поделитесь своими отзывами о конкретных переломных моментах, которые вы можете обнаружить в отношении удобства использования данных.

Привлекайте и делитесь отзывами

Вы можете участвовать и экспериментировать с этим API .

Следующие шаги