Обзор службы агрегации

Разверните эту службу и управляйте ею для создания сводных отчетов для API отчетов об атрибуции или API частного агрегирования.

Разверните службу агрегирования и управляйте ею для обработки агрегированных отчетов из API отчетов об атрибуции или API частного агрегирования для создания сводного отчета .

Статус реализации

В пояснении изложены ключевые термины , полезные для понимания Службы агрегирования.

Доступность

Proposal Status
Aggregation Service support for Amazon Web Services (AWS) across Attribution Reporting API, Private Aggregation API
Explainer
Available
Aggregation Service support for Google Cloud across Attribution Reporting API, Private Aggregation API
Explainer
Available in beta
Aggregation Service site enrollment and mapping of a site to cloud accounts (AWS, or GCP)
FAQs on GitHub
Available
The Aggregation Service's epsilon value will be kept as a range of up to 64, to facilitate experimentation and feedback on different parameters.
Submit ARA epsilon feedback.
Submit PAA epsilon feedback.
Available. We will provide advanced notice to the ecosystem before the epsilon range values are updated.
More flexible contribution filtering for Aggregation Service queries
Explainer
Expected Q2 2024
Process for budget recovery post-disasters (errors, misconfigurations, and so on)
GitHub issue
Expected Q2 2024
Accenture operating as one of the Coordinators on AWS
Developer Blog
Available
Independent party operating as one of the Coordinators on Google Cloud
Developer Blog
Expected Q3 2024

Безопасная обработка данных

Служба агрегации расшифровывает и объединяет собранные данные из агрегируемых отчетов, добавляет шум и возвращает окончательный сводный отчет. Эта служба работает в доверенной среде выполнения (TEE), которая развертывается в облачной службе, поддерживающей необходимые меры безопасности для защиты этих данных.

Код TEE — единственное место в Службе агрегирования, имеющее доступ к необработанным отчетам. Этот код будет проверяться исследователями безопасности, защитниками конфиденциальности и специалистами по рекламе. Чтобы подтвердить, что TEE использует именно утвержденное программное обеспечение и что данные остаются в безопасности, координатор проводит аттестацию.

Агрегированные отчеты собираются, группируются и отправляются в TEE для преобразования в окончательный сводный отчет.
Агрегированные отчеты собираются, группируются и отправляются в службу агрегирования, работающую на TEE. Среда службы агрегации принадлежит и управляется той же стороной, которая собирает данные.

Координатор аттестации ТЭЭ

Координатор – лицо, отвечающее за ключевое управление и учет сводных отчетов.

У координатора есть несколько обязанностей:

  • Ведите список разрешенных бинарных изображений. Эти изображения представляют собой криптографические хэши сборок программного обеспечения Службы агрегирования, которые Google периодически выпускает. Это будет воспроизводимо, чтобы любая сторона могла убедиться, что образы идентичны сборкам Службы агрегации.
  • Используйте систему управления ключами. Ключи шифрования необходимы Chrome на устройстве пользователя для шифрования сводных отчетов. Ключи расшифровки необходимы для подтверждения соответствия кода службы агрегации двоичным изображениям.
  • Отслеживайте агрегированные отчеты, чтобы предотвратить повторное использование при агрегировании сводных отчетов, поскольку повторное использование может раскрыть личную информацию (PII).

Правило «Нет дубликатов»

Чтобы получить представление о содержимом конкретного сводного отчета, злоумышленник может сделать несколько копий отчета и включить эти копии в один или несколько пакетов. По этой причине Служба агрегации применяет правило «нет дубликатов»:

  • В пакете . Агрегированный отчет может появиться в пакете только один раз.
  • По пакетам . Агрегированные отчеты не могут появляться более чем в одном пакете или входить в более чем один сводный отчет.

Для этого браузер присваивает каждому агрегированному отчету общий идентификатор. Браузер генерирует общий идентификатор на основе нескольких точек данных, включая: версию API, источник отчетов, целевой сайт, время регистрации источника и запланированное время отчета. Эти данные поступают из shared_info в отчете.

Служба агрегации подтверждает, что все агрегируемые отчеты с одинаковым общим идентификатором находятся в одном пакете, и сообщает координатору, что общий идентификатор был обработан. Если создается несколько пакетов с одним и тем же идентификатором, для агрегирования может быть принят только один пакет, а остальные пакеты отклоняются.

При выполнении отладки правило «без дубликатов» не применяется к пакетам. Другими словами, отчеты из предыдущих пакетов могут появиться в ходе отладки. Однако правило по-прежнему применяется внутри пакета. Это позволяет вам экспериментировать с сервисом и различными стратегиями пакетной обработки, не ограничивая будущую обработку в производственной среде.

Шум и масштабирование

Чтобы защитить конфиденциальность пользователей, служба агрегации применяет механизм аддитивного шума к необработанным данным из агрегируемых отчетов. Это означает, что к каждому совокупному значению добавляется определенное количество статистического шума перед его публикацией в сводном отчете.

Хотя вы не можете напрямую контролировать способы добавления шума, вы можете влиять на влияние шума на данные измерений.

Шум является постоянным, независимо от совокупного значения.

Значение шума случайным образом извлекается из распределения вероятностей Лапласа , и распределение одинаковое независимо от объема данных, собранных в агрегированных отчетах. Чем больше данных вы соберете, тем меньшее влияние шум окажет на результаты сводного отчета. Вы можете умножить данные агрегированного отчета на коэффициент масштабирования, чтобы уменьшить влияние шума.

Чтобы понять, как добавляется шум, ваши элементы управления и влияние на ваши отчеты, обратитесь к разделам «Бюджет вклада» и «Масштабирование до бюджета вклада» в разделе «Работа с шумом» .

Создание сводных отчетов

Создание сводного отчета зависит от использования вами API. Узнайте больше о создании сводных отчетов для API частного агрегирования и API отчетов по атрибуции .

Тестирование службы агрегации

Мы рекомендуем прочитать соответствующее руководство для каждого тестируемого API:

Чтобы протестировать сервис агрегации на AWS, ознакомьтесь с этими инструкциями .

Также доступен локальный инструмент тестирования для обработки агрегированных отчетов для отчетов по атрибуции и API частного агрегирования.

Платформа нагрузочного тестирования служб агрегации предоставляет предлагаемую среду тестирования.

Привлекайте и делитесь отзывами

Служба агрегации — это ключевой элемент API-интерфейсов измерения Privacy Sandbox. Как и другие API Privacy Sandbox, это документировано и публично обсуждается на GitHub.