Descripción general del servicio de agregación

Implementa y administra este servicio para producir informes de resumen para la API de Attribution Reporting o la API de Private Aggregation.

Implementa y administra un servicio de agregación para procesar informes agregables de la API de Attribution Reporting o la API de Private Aggregation para crear un informe de resumen.

Estado de implementación

En la explicación, se describen términos clave que son útiles para comprender el servicio de agregación.

Disponibilidad

Propuesta Estado
Compatibilidad del servicio de agregación con Amazon Web Services (AWS) en la API de Attribution Reporting, la API de Private Aggregation
Explainer
Disponible
Compatibilidad del servicio de agregación para Google Cloud en la API de Attribution Reporting y la API de Private Aggregation
Explicación
Disponible en versión beta
Inscripción del sitio del servicio de agregación y asignación de un sitio a cuentas en la nube (AWS o GCP)
Preguntas frecuentes en GitHub
Disponible
El valor épsilon del servicio de agregación se mantendrá como un rango de hasta 64, para facilitar la experimentación y los comentarios sobre diferentes parámetros.
Envía comentarios de épsilon de AAR.
Envía comentarios de épsilon de PAA.
Disponible. Proporcionaremos un aviso anticipado al ecosistema antes de que se actualicen los valores del rango de épsilon.
Filtrado de contribuciones más flexible para las consultas del servicio de agregación
Explicación
Se espera para el 2o trim. de 2024
Proceso para la recuperación de presupuestos posteriores a desastres (errores, parámetros de configuración incorrectos, etcétera)
Problema de GitHub
Se espera para el 2o trim. de 2024
Accenture opera como uno de los coordinadores de AWS
Blog para desarrolladores
Disponible
Parte independiente que opera como uno de los coordinadores de Google Cloud
Blog para desarrolladores
Se espera para el 3er trim. de 2024

Procesamiento seguro de datos

El servicio de agregación desencripta y combina los datos recopilados de los informes agregables, agrega ruido y muestra el informe de resumen final. Este servicio se ejecuta en un entorno de ejecución confiable (TEE), que se implementa en un servicio en la nube que admite las medidas de seguridad necesarias para proteger estos datos.

El código del TEE es el único lugar en el servicio de agregación que tiene acceso a informes sin procesar. Los investigadores de seguridad, los promotores de la privacidad y las tecnologías publicitarias podrán auditar este código. Para confirmar que el TEE esté ejecutando el software aprobado exacto y que los datos permanezcan protegidos, un coordinador lleva a cabo la certificación.

Los informes agregables se recopilan, se agrupan en lotes y se envían al TEE para transformarse en un informe de resumen final.
Los informes agregables se recopilan, se agrupan en lotes y se envían al servicio de agregación, que se ejecuta en un TEE. El entorno del Servicio de agregación es propiedad y está administrado por la misma parte que recopila los datos.

Certificación del coordinador del TEE

El coordinador es una entidad responsable de la administración de claves y la contabilidad de informes agregables.

Un coordinador tiene varias responsabilidades:

  • Mantener una lista de imágenes binarias autorizadas Estas imágenes son hashes criptográficos de las compilaciones de software del servicio de agregación, que Google lanzará periódicamente. Esto se podrá reproducir para que cualquier parte pueda verificar que las imágenes sean idénticas a las compilaciones del servicio de agregación.
  • Opera un sistema de administración de claves. Las claves de encriptación son necesarias para que Chrome en el dispositivo de un usuario encripte los informes agregables. Las claves de desencriptación son necesarias para demostrar que el código del servicio de agregación coincide con las imágenes binarias.
  • Realiza un seguimiento de los informes agregables para evitar que se vuelvan a agregar para informes de resumen, ya que esta puede revelar información de identificación personal (PII).

Regla "Sin duplicados"

Para obtener estadísticas sobre el contenido de un informe agregable específico, un atacante puede hacer varias copias del informe y, luego, incluir esas copias en uno o varios lotes. Debido a esto, el servicio de agregación aplica una regla de “no duplicados”:

  • En un lote: Un informe agregable solo puede aparecer una vez dentro de un lote.
  • En lotes: Los informes agregables no pueden aparecer en más de un lote ni contribuir a más de un informe de resumen.

Para ello, el navegador asigna un ID compartido a cada informe agregable. El navegador genera el ID compartido a partir de varios datos, incluidos la versión de la API, el origen del informe, el sitio de destino, la hora de registro de la fuente y la hora del informe programado. Estos datos provienen del campo shared_info del informe.

El servicio de agregación confirma que todos los informes agregables con el mismo ID compartido están en el mismo lote y le informa al coordinador que se procesó el ID compartido. Si se crean varios lotes con el mismo ID, solo se puede aceptar un lote para la agregación y se rechazan los otros.

Cuando realizas una ejecución de depuración, la regla "sin duplicados" no se aplica de manera forzosa en los lotes. En otras palabras, los informes de lotes anteriores pueden aparecer en una ejecución de depuración. Sin embargo, la regla aún se aplica dentro de un lote. Esto te permite experimentar con el servicio y varias estrategias de lote, sin limitar el procesamiento futuro en un entorno de producción.

Ruido y escalamiento

Para proteger la privacidad del usuario, el servicio de agregación aplica un mecanismo de ruido aditivo a los datos sin procesar provenientes de informes agregables. Esto significa que se agrega una cierta cantidad de ruido estadístico a cada valor agregado antes de su lanzamiento en un informe de resumen.

Si bien no tienes el control directo de las formas en que se agrega el ruido, puedes influir en el impacto del ruido en sus datos de medición.

El ruido es constante, independientemente del valor agregado.

El valor de ruido se obtiene de forma aleatoria de una distribución de probabilidad de Laplace, y la distribución es la misma sin importar la cantidad de datos recopilados en los informes agregables. Cuantos más datos recopiles, menos impacto tendrá el ruido en los resultados del informe de resumen. Puedes multiplicar los datos del informe agregables por un factor de escala para reducir el impacto del ruido.

Para comprender cómo se agrega el ruido, tus controles y el impacto en tus informes, consulta Presupuesto de contribución y Escala verticalmente el presupuesto de contribución en Cómo trabajar con el ruido.

Genera informes de resumen

La generación de informes de resumen depende del uso de la API. Obtén más información sobre cómo generar informes de resumen para la API de Private Aggregation y la API de Attribution Reporting.

Prueba el servicio de agregación

Te recomendamos que leas la guía correspondiente para cada API que pruebes:

Para probar el servicio de agregación en AWS, consulta estas instrucciones.

También hay una herramienta de prueba local disponible para procesar informes agregables para Attribution Reporting y la API de Private Aggregation.

El framework de prueba de carga del servicio de agregación proporciona un framework de prueba sugerido.

Interactúa y comparte comentarios

El servicio de agregación es una pieza clave de las APIs de medición de Privacy Sandbox. Al igual que otras APIs de Privacy Sandbox, esto se documenta y analiza de forma pública en GitHub.