Проверки конфиденциальности в Ads Data Hub

В основе работы Ads Data Hub лежит забота о конфиденциальности конечных пользователей. Чтобы защитить конфиденциальность данных и помочь нашим клиентам соблюсти нормативные требования, мы проводим определенные проверки и применяем ограничения. Благодаря этому данные об отдельных пользователях1 не попадают в отчеты, которые вы получаете на нашей платформе. Ниже приводится краткое описание этих проверок. Более подробные сведения вы найдете далее в этой статье.

  • Статические проверки позволяют проанализировать операторы в ваших запросах, чтобы найти очевидные и непосредственные проблемы с конфиденциальностью, например такие:
    • экспорт идентификаторов пользователей или любых их функций;
    • использование запрещенных функций для полей, которые содержат данные на уровне отдельного пользователя.
  • Бюджет доступа к данным ограничивает количество обращений к одному и тому же фрагменту данных. Если бюджет скоро будет исчерпан, пользователь получит сообщение о конфиденциальности DATA_ACCESS_BUDGET_IS_NEARLY_EXHAUSTED. Вы также можете отслеживать бюджет доступа к данным в точке входа или с помощью уведомлений в интерфейсе.
  • Требования к агрегированию гарантируют, что в каждой строке содержатся данные достаточного количества конечных пользователей, чтобы защитить их конфиденциальность.
  • Проверки различий используются для сравнения результатов текущей задачи с предыдущими результатами и строками, которые находятся в том же наборе результатов. Сравнение данных из разных наборов пользователей, которые соответствуют нашим требованиям к агрегированию, предотвращает сбор информации об отдельных пользователях. Проверка различий может выявить нарушения, если между выполнением двух заданий были изменены исходные данные.

Если результат не проходит проверку конфиденциальности, Ads Data Hub показывает или возвращает сообщение о том, что строка отфильтрована. Это может происходить как для одной строки, так и для всего набора результатов. Чтобы отчет был точным, учитывайте данные из исключенных строк с помощью сводки по отфильтрованной строке2.

Требования к агрегированию

Проверки конфиденциальности Ads Data Hub основываются на пороге агрегации. Для большинства запросов данные отчетов можно получить только для 50 или более пользователей. При этом запросы сведений только по кликам и конверсиям могут получать ответы с данными не менее чем 10 пользователей. Этот порог агрегации не учитывает пользователей с пустыми идентификаторами.

В примере ниже строка с кампанией 125 будет отфильтрована из итоговых результатов, поскольку в ней агрегируются данные о 48 пользователях, тогда как минимальное значение – 50. Отфильтрованные строки исключаются из результатов из-за требований конфиденциальности.

Кампания Пользователи Показы
123 314 928
124 2718 5772
125 48 353

Проверки различий

Проверки различий помогают исключить возможность идентификации пользователей при сравнении нескольких наборов агрегированных результатов. Сравнивая результаты одного задания с полученными ранее, Ads Data Hub ищет уязвимости на уровне отдельных пользователей. По этой причине система может отфильтровать даже результаты из разных кампаний или с одинаковым количеством пользователей, если в них много данных одних и тех же пользователей.

С другой стороны, в двух наборах агрегированных результатов может быть одинаковое количество пользователей и они могут казаться идентичными, но в них не будет данных одних и тех же пользователей. В этом случае конфиденциальность будет соблюдена и такие результаты не будут отфильтрованы.

Оценивая уязвимость нового результата, Ads Data Hub опирается на данные предыдущих результатов. Это означает, что при многократном выполнении одного и того же запроса создается больше данных, позволяющих оценить уязвимость новых результатов в ходе проверки различий. Кроме того, могут измениться исходные данные. В этом случае запросы, которые ранее стабильно проходили проверку, возможно, начнут нарушать требования конфиденциальности.

Если результаты на уровне задания различаются достаточно, но отдельная строка похожа на строку в предыдущем задании, Ads Data Hub ее отфильтрует. В примере ниже строка с кампанией 123 будет отфильтрована из результатов второго задания, так как отличается от результатов первого только на одного пользователя.

Задание 1 Задание 2
Идентификатор кампании Пользователи Идентификатор кампании Пользователи
123 400 123 401
124 569 224 1325

Если общее количество пользователей во всех строках в наборе результатов схоже с количеством пользователей в предыдущем задании, Ads Data Hub отфильтрует такой набор полностью. В примере ниже будут отфильтрованы все результаты второго задания.

Задание 1 Задание 2
Идентификатор кампании Пользователи Идентификатор кампании Пользователи
123 400 123 402
124 1367 124 1367

Сводка по отфильтрованным строкам

Сводки по отфильтрованным строкам содержат общие сведения о том, какие данные были отфильтрованы в результате проверок конфиденциальности. Для этого данные из отфильтрованных строк суммируются и добавляются в агрегированную строку. Такие данные невозможно проанализировать подробно, но они дают представление о том, какой объем информации был отфильтрован.

Рекомендации по составлению запросов

Если ваш запрос SQL действителен, но значительная часть его результатов отфильтровывается, воспользуйтесь практическими рекомендациями по составлению запросов.

Причины, по которым результаты могут отфильтровываться:

Как посмотреть рекомендации:

  • Интерфейс. Рекомендации показываются в редакторе над текстом запроса.
  • API. Используйте метод customers.analysisQueries.validate.

  1. Кроме тех данных, на передачу которых пользователи (например, респонденты опросов) дали свое согласие. 

  2. Если они не исключены из-за ограничений, связанных с конфиденциальностью (например, когда пользовательские данные, включенные в сводку по отфильтрованным строкам, не соответствуют требованиям к агрегированию).