Laboratorio de ruido

Acerca de este documento

Cuando leas este artículo, aprenderás a hacer lo siguiente:

  • Comprende qué estrategias crear antes de generar informes de resumen.
  • Conocer Noise Lab, una herramienta que ayuda a comprender los efectos de varios parámetros de ruido y que permite explorar y evaluar rápidamente varias estrategias de administración del ruido.
Captura de pantalla de Noise Lab
Lab de ruido

Comparte tus comentarios

Si bien en este documento se resumen algunos principios para trabajar con informes de resumen, existen varios enfoques sobre la administración del ruido que pueden no reflejarse aquí. Sus sugerencias, elementos agregados y preguntas son bienvenidos.

  • Para proporcionar comentarios públicos sobre las estrategias de administración de ruido, la utilidad o la privacidad de la API (épsilon) y compartir tus observaciones durante la simulación con Noise Lab, haz lo siguiente: Comentario sobre este problema
  • Para enviar comentarios públicos sobre Noise Lab (haz una pregunta, informa un error o solicita una función): Crea un problema nuevo aquí
  • Para enviar comentarios públicos sobre otro aspecto de la API, consulta Crea un problema nuevo aquí.

Antes de comenzar

  1. Consulta Attribution Reporting: informes de resumen y la descripción general del sistema completo de Attribution Reporting para obtener una introducción.
  2. Busca Información sobre el ruido y Información sobre las claves de agregación para aprovechar al máximo esta guía.

Decisiones de diseño

Principio básico del diseño

Existen diferencias básicas entre el funcionamiento de las cookies de terceros y los informes de resumen. Una diferencia clave es el ruido que se agrega a los datos de medición en los informes de resumen. Otra es la forma en que se programan los informes.

Para acceder a los datos de medición del informe de resumen con una mayor relación señal-ruido, las plataformas orientadas a la demanda (DSP) y los proveedores de medición de anuncios deberán trabajar con sus anunciantes para desarrollar estrategias de administración del ruido. Para desarrollar estas estrategias, las DSP y los proveedores de medición deben tomar decisiones de diseño. Estas decisiones giran en torno a un concepto esencial:

Si bien se extraen los valores de ruido de distribución, en términos generales, solo dependen de dos parámetros ⏤épsilon y el presupuesto de contribución⏤, tienes a tu disposición otros controles que afectarán las relaciones señal-ruido de tus datos de medición de salida.

Si bien esperamos que un proceso iterativo conduzca a las mejores decisiones, cada variación en estas decisiones conducirá a una implementación ligeramente diferente. Por lo tanto, estas decisiones deben tomarse antes de escribir cada iteración del código (y antes de publicar anuncios).

Decisión: Nivel de detalle de la dimensión

Pruébalo en Noise Lab

  1. Ve al Modo avanzado.
  2. En el panel lateral Parámetros, busca Tus datos de conversiones.
  3. Observa los parámetros predeterminados. De forma predeterminada, el recuento de conversiones atribuibles diarias TOTAL es de 1,000. El promedio es de aproximadamente 40 por bucket si usas la configuración predeterminada (dimensiones predeterminadas, cantidad predeterminada de valores diferentes posibles para cada dimensión y estrategia clave A). Observa que el valor es 40 en la entrada Promedio diario de conversiones atribuibles POR BUCKET.
  4. Haz clic en Simular para ejecutar una simulación con los parámetros predeterminados.
  5. En el panel lateral Parámetros, busca Dimensiones. Cambia el nombre de Geography a City y cambia la cantidad de valores diferentes posibles a 50.
  6. Observa cómo esto cambia el recuento de conversiones atribuibles diarias promedio PER BUCKET. Ahora es mucho más bajo. Esto se debe a que, si aumentas la cantidad de valores posibles dentro de esta dimensión sin cambiar nada más, aumentarás la cantidad total de buckets sin cambiar cuántos eventos de conversión habrá en cada uno.
  7. Haz clic en Simular.
  8. Observa las relaciones de ruido de la simulación resultante: ahora son más altas que en la simulación anterior.

Dado el principio de diseño principal, es probable que los valores de resumen pequeños sean más ruidosos que los valores de resumen grandes. Por lo tanto, tu elección de configuración afecta la cantidad de eventos de conversión atribuidos que terminan en cada bucket (de lo contrario, se denomina clave de agregación) y esa cantidad afecta el ruido en los informes de resumen de resultados finales.

Una decisión de diseño que influye en la cantidad de eventos de conversión atribuidos en un solo bucket es el nivel de detalle de la dimensión. Considera los siguientes ejemplos de claves de agregación y sus dimensiones:

  • Enfoque 1: Una estructura clave con dimensiones generales: País x Campaña publicitaria (o el bucket de agregación de campaña más grande) x Tipo de producto (de un total de 10 tipos de productos posibles)
  • Enfoque 2: Una estructura clave con dimensiones detalladas: Ciudad x ID de la creatividad x Producto (de un total de 100 productos posibles)

Ciudad es una dimensión más detallada que País, ID de creatividad es más detallado que Campaña y Producto más detallado que Tipo de producto. Por lo tanto, el enfoque 2 tendrá una cantidad menor de eventos (conversiones) por bucket (= por clave) en el resultado de su informe de resumen que el enfoque 1. Dado que el ruido que se agrega al resultado es independiente de la cantidad de eventos en el bucket, los datos de medición de los informes de resumen serán más ruidosos con el Enfoque 2. Para cada anunciante, experimenta con varias compensaciones de nivel de detalle en el diseño de la clave a fin de tener la máxima utilidad en los resultados.

Decisión: Estructuras clave

Pruébalo en Noise Lab

En el modo simple, se usa la estructura de clave predeterminada. En el Modo avanzado, puedes experimentar con diferentes estructuras de claves. Se incluyen algunos ejemplos de dimensiones; también puedes modificarlas.

  1. Ve al Modo avanzado.
  2. En el panel lateral Parámetros, busca Estrategia clave. Observa que la estrategia predeterminada, denominada A en la herramienta, usa una estructura de clave detallada que incluye todas las dimensiones: ubicación geográfica x ID de campaña x categoría de producto.
  3. Haz clic en Simular.
  4. Observa las relaciones de ruido de la simulación resultante.
  5. Cambia la estrategia Key a B. Se mostrarán controles adicionales para que configures la estructura clave.
  6. Configura tu estructura de claves, p.ej., de la siguiente manera:
    1. Cantidad de estructuras de claves: 2
    2. Estructura clave 1 = Geografía x Categoría de producto
    3. Estructura clave 2 = ID de campaña × Categoría de producto.
  7. Haz clic en Simular.
  8. Ten en cuenta que ahora obtienes dos informes de resumen por tipo de objetivo de medición (dos para el recuento de compras y dos para el valor de la compra), ya que usas dos estructuras de claves distintas. Observa sus relaciones de ruido.
  9. También puedes probar esto con tus propias dimensiones personalizadas. Para ello, busca Datos de los que deseas hacer un seguimiento: Dimensiones. Considera quitar las dimensiones de ejemplo y crear una propia con los botones Agregar, quitar o restablecer debajo de la última dimensión.

Otra decisión de diseño que afectará la cantidad de eventos de conversión atribuidos dentro de un solo bucket son las estructuras de claves que decidas usar. Considera los siguientes ejemplos de claves de agregación:

  • La estrategia clave es A.
  • Dos estructuras clave, cada una con un subconjunto de dimensiones; llamaremos a esta estrategia clave B.
Diagrama:

La estrategia A es más simple, pero es posible que debas sumar (sumar) los valores de resumen contaminados incluidos en los informes de resumen para acceder a ciertas estadísticas. Si sumas estos valores, también sumas el ruido. Con la estrategia B, es posible que los valores de resumen expuestos en los informes de resumen ya te proporcionen la información que necesitas. Esto significa que la estrategia B probablemente generará mejores relaciones señal-ruido que la estrategia A. Sin embargo, el ruido puede ya ser aceptable con la Estrategia A, por lo que aún puedes optar por favorecer la Estrategia A por simplicidad. Obtenga más información en el ejemplo detallado que describe estas dos estrategias.

La administración de claves es un tema profundo. Se pueden considerar varias técnicas elaboradas para mejorar las relaciones señal-ruido. Una se describe en Administración de claves avanzada.

Decisión: Frecuencia de procesamiento por lotes

Pruébalo en Noise Lab

  1. Ve al modo simple (o al modo Avanzado; ambos modos funcionan de la misma manera cuando se trata de la frecuencia de lotes).
  2. En el panel lateral Parámetros, busca Tu estrategia de agregación > Frecuencia de procesamiento por lotes. Esto se refiere a la frecuencia de procesamiento por lotes de los informes agregables que se procesan con el servicio de agregación en un solo trabajo.
  3. Observa la frecuencia de lote predeterminada: de forma predeterminada, se simula una frecuencia de lote diaria.
  4. Haz clic en Simular.
  5. Observa las relaciones de ruido de la simulación resultante.
  6. Cambia la frecuencia de lote a semanal.
  7. Observa las relaciones de ruido de la simulación resultante: ahora son más bajas (mejores) que en la simulación anterior.

Otra decisión de diseño que afectará la cantidad de eventos de conversión atribuidos en un solo bucket es la frecuencia de procesamiento por lotes que decidas usar. La frecuencia de procesamiento por lotes es la frecuencia con la que procesas informes agregables.

Un informe programado para agregar con más frecuencia (p.ej., cada hora) incluirá menos eventos de conversión que el mismo informe con un programa de agregación menos frecuente (p.ej., cada semana). Como resultado, el informe por hora incluirá más ruido.``` incluirá menos eventos de conversión que el mismo informe con una programación de agregación menos frecuente (p.ej., cada semana). Como resultado, el informe por hora tendrá una relación señal-ruido menor que el informe semanal, en las mismas condiciones. Experimenta con los requisitos de informes en varias frecuencias y evalúa la relación señal-ruido para cada una.

Obtén más información en Agrupación en lotes y Agrega durante períodos más largos.

Decisión: Variables de la campaña que afectan las conversiones atribuibles

Pruébalo en Noise Lab

Si bien esto puede ser difícil de predecir y puede tener variaciones significativas además de los efectos de la estacionalidad, intenta calcular la cantidad diaria de conversiones atribuibles de un solo punto de contacto a la potencia más cercana de 10: 10, 100, 1,000 o 10,000.

  1. Ve al Modo avanzado.
  2. En el panel lateral Parámetros, busca Tus datos de conversiones.
  3. Observa los parámetros predeterminados. De forma predeterminada, el recuento de conversiones atribuibles diarias TOTAL es de 1,000. El promedio es de aproximadamente 40 por bucket si usas la configuración predeterminada (dimensiones predeterminadas, cantidad predeterminada de valores diferentes posibles para cada dimensión y estrategia clave A). Observa que el valor es 40 en la entrada Promedio diario de conversiones atribuibles POR BUCKET.
  4. Haz clic en Simular para ejecutar una simulación con los parámetros predeterminados.
  5. Observa las relaciones de ruido de la simulación resultante.
  6. Ahora, establece el recuento de conversiones atribuibles diarias TOTAL en 100. Observa que esto reduce el valor del recuento de conversiones atribuibles diarias promedio PER BUCKET.
  7. Haz clic en Simular.
  8. Observa que las relaciones de ruido ahora son más altas: esto se debe a que, cuando tienes menos conversiones por bucket, se aplica más ruido para mantener la privacidad.

Una distinción importante es la cantidad total de conversiones posibles para un anunciante en comparación con la cantidad total de conversiones atribuidas posibles. Esto último es lo que, en última instancia, afecta el ruido en los informes de resumen. Las conversiones atribuidas son un subconjunto de las conversiones totales que son propensas a las variables de la campaña, como el presupuesto y la segmentación del anuncio. Por ejemplo, esperarías que el número de conversiones atribuidas sea mayor en una campaña publicitaria de USD 10 millones en comparación con una campaña publicitaria de USD 10,000, en las mismas condiciones.

Ten en cuenta lo siguiente:

  • Evalúa las conversiones atribuidas en función de un modelo de atribución del mismo dispositivo de un solo toque, ya que están dentro del alcance de los informes de resumen recopilados con la API de Attribution Reporting.
  • Considera un recuento del peor de los casos y uno del mejor de los casos para las conversiones atribuidas. Por ejemplo, en igualdad de condiciones, considera los presupuestos mínimos y máximos posibles de la campaña para un anunciante y, luego, proyecta las conversiones atribuibles a ambos resultados como entradas en tu simulación.
  • Si estás considerando usar Privacy Sandbox de Android, considera las conversiones atribuidas multiplataforma en el cálculo.

Decisión: Usar el escalamiento

Pruébalo en Noise Lab

  1. Ve al Modo avanzado.
  2. En el panel lateral Parámetros, busca Tu estrategia de agregación > Escalamiento. Está configurada en Sí de forma predeterminada.
  3. Para comprender los efectos positivos del escalamiento en la relación de ruido, primero establece Escalamiento en No.
  4. Haz clic en Simular.
  5. Observa las relaciones de ruido de la simulación resultante.
  6. Establece el escalamiento en Sí. Ten en cuenta que Noise Lab calcula automáticamente los factores de escalamiento que se usarán según los rangos (valores promedio y máximos) de los objetivos de medición para tu situación. En una configuración de prueba de origen o sistema real, te recomendamos que implementes tu propio cálculo de los factores de escalamiento.
  7. Haz clic en Simular.
  8. Observa que las relaciones de ruido ahora son más bajas (mejores) en esta segunda simulación. Esto se debe a que estás usando el escalamiento.

Según el principio de diseño básico, el ruido que se agrega es una función del presupuesto de contribución.

Por lo tanto, para aumentar la proporción señal/ruido, puedes decidir transformar los valores recopilados durante un evento de conversión. Para ello, escálalos en función del presupuesto de contribución (y desajusta después de la agregación). Usa el escalamiento para aumentar la relación señal-ruido.

Decisión: Cantidad de objetivos de medición y división del presupuesto de privacidad

Esto se relaciona con el escalamiento; asegúrate de leer Usa el escalamiento.

Pruébalo en Noise Lab

Un objetivo de medición es un dato distinto recopilado en los eventos de conversión.

  1. Ve al Modo avanzado.
  2. En el panel lateral Parámetros, busca Datos de los que deseas hacer un seguimiento: Objetivos de medición. De forma predeterminada, tienes dos objetivos de medición: valor de compra y recuento de compras.
  3. Haz clic en Simular para ejecutar una simulación con los objetivos predeterminados.
  4. Haz clic en Quitar. Esta acción quitará el último objetivo de medición (en ese caso, el recuento de compras).
  5. Haz clic en Simular.
  6. Observa que las relaciones de ruido para el valor de compra ahora son más bajas (mejores) para esta segunda simulación. Esto se debe a que tienes menos objetivos de medición, por lo que tu único objetivo de medición ahora recibe todo el presupuesto de contribución.
  7. Haz clic en Restablecer. Ahora tienes otra vez dos objetivos de medición: valor de compra y recuento de compras. Ten en cuenta que Noise Lab calcula automáticamente los factores de escalamiento que se usarán según los rangos (valores promedio y máximos) de los objetivos de medición para tu situación. De forma predeterminada, Noise Lab divide el presupuesto de manera equitativa entre los objetivos de medición.
  8. Haz clic en Simular.
  9. Observa las relaciones de ruido de la simulación resultante. Toma nota de los factores de escala que se muestran en la simulación.
  10. Ahora, personalicemos la división del presupuesto de privacidad para lograr una mejor relación señal-ruido.
  11. Ajusta el porcentaje del presupuesto asignado a cada objetivo de medición. Dados los parámetros predeterminados, el objetivo de medición 1, es decir, el valor de compra, tiene un rango mucho más amplio (entre 0 y 1,000) que el objetivo de medición 2, es decir, el recuento de compras (entre 1 y 1, es decir, siempre igual a 1). Por este motivo, necesita "más espacio para escalar": lo ideal sería asignar más presupuesto de contribución al objetivo de medición 1 que al objetivo de medición 2, de modo que se pueda escalar de manera más eficiente (consulta Escalamiento) y, por lo tanto,
  12. Asigna el 70% del presupuesto al objetivo de medición 1. Asigna un 30% al objetivo de medición 2.
  13. Haz clic en Simular.
  14. Observa las relaciones de ruido de la simulación resultante. En cuanto al valor de compra, las relaciones de ruido ahora son notablemente más bajas (mejores) que en la simulación anterior. En el recuento de compras, no se modifican.
  15. Sigue ajustando la división del presupuesto entre diferentes métricas. Observa cómo esto afecta el ruido.

Ten en cuenta que puedes establecer tus propios objetivos de medición personalizados con los botones Agregar, quitar o restablecer.


Si mides un dato (objetivo de medición) en un evento de conversión, como el recuento de conversiones, ese dato puede obtener todo el presupuesto de contribución (65,536). Si estableces varios objetivos de medición en un evento de conversión, como el recuento de conversiones y el valor de compra, esos datos deberán compartir el presupuesto de contribución. Esto significa que tienes menos flexibilidad para escalar verticalmente los valores.

Por lo tanto, cuantos más objetivos de medición tengas, es probable que haya una relación señal-ruido más baja (mayor ruido).

Otra decisión que debes tomar respecto de los objetivos de medición es la división del presupuesto. Si divides el presupuesto de contribución en partes iguales entre dos datos, cada dato obtiene un presupuesto de 65536/2 = 32768. Esto puede o no ser óptimo según el valor máximo posible para cada dato. Por ejemplo, si mides un recuento de compras que tiene un valor máximo de 1 y un valor de compra con un mínimo de 1 y un máximo de 120, el valor de compra se beneficiaría de tener "más espacio" para escalar verticalmente, es decir, para recibir una proporción mayor del presupuesto de contribución. Verás si algunos objetivos de medición deben priorizarse por sobre otros en relación con el impacto del ruido.

Decisión: Administración de valores atípicos

Pruébalo en Noise Lab

Un objetivo de medición es un dato distinto recopilado en los eventos de conversión.

  1. Ve al Modo avanzado.
  2. En el panel lateral Parámetros, busca Tu estrategia de agregación > Escalamiento.
  3. Asegúrate de que el escalamiento esté configurado en Sí. Ten en cuenta que Noise Lab calcula automáticamente los factores de escalamiento que se usarán, según los rangos (valores promedio y máximos) que proporcionaste para los objetivos de medición.
  4. Supongamos que la compra más grande realizada fue de USD 2,000, pero la mayoría se encuentra en el rango de USD 10 a USD 120. Primero, veamos lo que sucede si usamos un enfoque de escalamiento literal (no recomendado): ingresa $2,000 como el valor máximo de purchaseValue.
  5. Haz clic en Simular.
  6. Observa que las relaciones de ruido son altas. Esto se debe a que, actualmente, nuestro factor de escala se calcula en función de USD 2,000, cuando, en realidad, la mayoría de los valores de compra serán notablemente inferiores.
  7. Ahora, usemos un enfoque de escalamiento más pragmático. Cambia el valor máximo de compra a USD 120.
  8. Haz clic en Simular.
  9. Observa que las relaciones de ruido son menores (mejores) en esta segunda simulación.

Por lo general, para implementar el escalamiento, debes calcular un factor de escalamiento basado en el valor máximo posible para un evento de conversión determinado (obtén más información en este ejemplo).

Sin embargo, evita usar un valor máximo literal para calcular ese factor de escala, ya que esto empeoraría las relaciones señal-ruido. En su lugar, quita los valores atípicos y usa un valor máximo pragmático.

La administración de valores atípicos es un tema profundo. Se pueden considerar varias técnicas elaboradas para mejorar las relaciones señal-ruido. Una se describe en Administración avanzada de valores atípicos.

Próximos pasos

Ahora que evaluaste varias estrategias de administración de ruido para tu caso de uso, estás listo para comenzar a experimentar con informes de resumen mediante la recopilación de datos de medición reales a través de una prueba de origen. Revisa las guías y sugerencias para probar la API.

Apéndice

Recorrido rápido por Noise Lab

Noise Lab te ayuda a evaluar y comparar rápidamente las estrategias de administración del ruido. Puedes usarla para lo siguiente:

  • Comprende los parámetros principales que pueden afectar el ruido y el efecto que tienen.
  • Simula el efecto del ruido en los datos de medición de salida según las diferentes decisiones de diseño. Ajusta los parámetros de diseño hasta que alcances una relación señal-ruido que funcione para tu caso de uso.
  • Comparte tus comentarios sobre la utilidad de los informes de resumen: ¿qué valores de épsilon y parámetros de ruido te funcionan bien y cuáles no? ¿Dónde están los puntos de inflexión?

Considéralo un paso de preparación. Noise Lab genera datos de medición para simular los resultados de un informe de resumen según tu entrada. No se conservan ni comparten datos.

Existen dos modos diferentes en Noise Lab:

  1. Modo simple: Comprende los aspectos básicos de los controles que tienes en el ruido.
  2. Modo avanzado: Prueba diferentes estrategias de administración de ruido y evalúa cuál genera la mejor relación señal/ruido para tus casos de uso.

Haz clic en los botones del menú superior para alternar entre los dos modos (#1 en la captura de pantalla de abajo).

Modo simple
  • Con el modo simple, puedes controlar los parámetros (que se encuentran en el lado izquierdo o el n. o 2 en la captura de pantalla que se muestra a continuación), como Épsilon, y ver cómo afectan el ruido.
  • Cada parámetro tiene un cuadro de información (un botón `?`). Haz clic en ellos para ver una explicación de cada parámetro (el n.o 3 en la captura de pantalla que aparece a continuación).
  • Para comenzar, haz clic en el botón "Simular" y observa cómo se ve el resultado (#4. en la captura de pantalla que aparece a continuación).
  • En la sección Salida, puedes ver varios detalles. Algunos elementos tienen un signo "?" junto a él. Tómate el tiempo de hacer clic en cada “?” para ver una explicación de los diversos datos.
  • En la sección Output, haz clic en el botón de activación Detalles si deseas ver una versión expandida de la tabla (#5. en la captura de pantalla a continuación).
  • Debajo de cada tabla de datos en la sección de resultados, hay una opción para descargar la tabla a fin de usarla sin conexión. Además, en la esquina inferior derecha, hay una opción para descargar todas las tablas de datos (#6 en la captura de pantalla de abajo).
  • Prueba diferentes configuraciones para los parámetros en la sección Parameters y haz clic en Simular para ver cómo afectan el resultado:
    Ruido
    Interfaz de Noise Lab para el modo simple.
Modo avanzado
  • En el modo Avanzado, tienes más control sobre los parámetros. Puedes agregar objetivos y dimensiones de medición personalizados (la 1 y la 2 en la siguiente captura de pantalla).
  • Desplázate hacia abajo en la sección Parámetros y consulta la opción Estrategia clave. Se puede usar para probar diferentes estructuras de claves (no 3 en la siguiente captura de pantalla).
    • Para probar diferentes estructuras clave, cambia la estrategia clave a "B".
    • Ingresa la cantidad de estructuras de teclas diferentes que deseas usar (el valor predeterminado es "2")
    • Haz clic en Generar estructuras clave.
    • A fin de ver opciones para especificar tus estructuras de claves, haz clic en las casillas de verificación junto a las claves que deseas incluir para cada estructura de claves.
    • Haga clic en Simular para ver el resultado.
      El Modo avanzado ofrece controles para los objetivos de medición y las dimensiones a las que se les realiza un seguimiento, destacados en la barra lateral.
      Interfaz de Noise Lab para el modo avanzado.
      El Modo avanzado también es una opción de Estrategia clave en la sección Parámetros de la barra lateral.
      Interfaz de Noise Lab para el modo avanzado.

Métricas de ruido

Concepto principal

El ruido se agrega para proteger la privacidad individual del usuario.

Un valor de ruido alto indica que los buckets o las claves están dispersos y contienen contribuciones de una cantidad limitada de eventos sensibles. Noise Lab realiza esta acción automáticamente para permitir que las personas "se oculten" o, en otras palabras, protege la privacidad de estas personas limitadas con una mayor cantidad de ruido adicional.

Un valor de ruido bajo indica que la configuración de datos se diseñó de tal manera que ya permite que las personas "se oculten entre la multitud". Esto significa que los buckets contienen contribuciones de una cantidad suficiente de eventos para garantizar la protección de la privacidad individual del usuario.

Esta instrucción es verdadera para el error porcentual promedio (APE) y RMSRE_T (error relativo de la raíz cuadrada de la media con un umbral).

APE (porcentaje promedio de error)

El APE es la relación entre el ruido sobre la señal, es decir, el valor de resumen verdadero.p> Los valores de APE más bajos implican una mejor relación señal-ruido.

Formula

Para un informe de resumen determinado, el APE se calcula de la siguiente manera:

La ecuación para el APE. Se requieren valores absolutos, ya que el ruido puede ser negativo.

True es el valor del resumen verdadero. APE es el promedio del ruido de cada valor de resumen real, promediado entre todas las entradas de un informe de resumen. Luego, en Noise Lab, esto se multiplica por 100 para obtener un porcentaje.

Pros y contras

Los buckets con tamaños más pequeños tienen un impacto desproporcionado en el valor final del APE. Eso podría ser engañoso a la hora de evaluar el ruido. Por eso agregamos otra métrica, RMSRE_T, que está diseñada para mitigar esta limitación de APE. Consulta los ejemplos para obtener más detalles.

Código

Revisa el código fuente para el cálculo del APE.

RMSRE_T (error relativo de la raíz cuadrada de la media con un umbral)

RMSRE_T (error relativo de la raíz cuadrada de la media con un umbral) es otra medida del ruido.

Cómo interpretar RMSRE_T

Los valores RMSRE_T más bajos implican mejores relaciones señal-ruido.
Por ejemplo, si una relación de ruido aceptable para tu caso de uso es del 20% y RMSRE_T es de 0.2, puedes estar seguro de que los niveles de ruido estarán dentro de tu rango aceptable.

Formula

Para un informe de resumen determinado, RMSRE_T se calcula de la siguiente manera:

Formula
La ecuación para RMSRE_T. Se requieren valores absolutos, ya que el ruido puede ser negativo.
Pros y contras

RMSRE_T es un poco más complejo de entender que APE. Sin embargo, tiene algunas ventajas que, en algunos casos, son más adecuados que el APE para analizar el ruido en los informes de resumen:

  • RMSRE_T es más estable. “T” es un umbral. "T" se usa para dar menos peso en el cálculo RMSRE_T a los buckets que tienen menos conversiones y, por lo tanto, son más sensibles al ruido debido a su tamaño pequeño. Con T, la métrica no tiene un aumento repentino en los buckets con pocas conversiones. Si T es igual a 5, un valor de ruido tan bajo como 1 en un bucket con 0 conversiones no se mostrará como más de 1. En cambio, se limitará a 0.2, lo que equivale a 1/5, mientras que T es igual a 5. Al darles menos peso a buckets más pequeños que, por lo tanto, son más sensibles al ruido, esta métrica es más estable y, por lo tanto, facilita la comparación de dos simulaciones.
  • RMSRE_T permite una agregación fácil. Conocer el RMSRE_T de varios buckets, junto con sus recuentos verdaderos, te permite calcular el RMSRE_T de la suma. Esto también te permite optimizar el rendimiento RMSRE_T para estos valores combinados.

Si bien la agregación es posible para el APE, la fórmula es bastante complicada, ya que involucra el valor absoluto de la suma de los ruidos de Laplace. Esto hace que el APE sea más difícil de optimizar.

Código

Revisa el código fuente para el cálculo de RMSRE_T.

Ejemplos

Informe de resumen con tres segmentos:

  • bucket_1 = ruido: 10, trueSummaryValue: 100
  • bucket_2 = ruido: 20, trueSummaryValue: 100
  • bucket_3 = ruido: 20, trueSummaryValue: 200

APE = (0.1 + 0.2 + 0.1) / 3 = 13%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14 

Informe de resumen con tres segmentos:

  • bucket_1 = ruido: 10, trueSummaryValue: 100
  • bucket_2 = ruido: 20, trueSummaryValue: 100
  • bucket_3 = ruido: 20, trueSummaryValue: 20

APE = (0.1 + 0.2 + 1) / 3 = 43%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

Informe de resumen con tres segmentos:

  • bucket_1 = ruido: 10, trueSummaryValue: 100
  • bucket_2 = ruido: 20, trueSummaryValue: 100
  • bucket_3 = ruido: 20, trueSummaryValue: 0

APE = (0.1 + 0.2 + Infinito) / 3 = Infinito

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

Administración de claves avanzada

Una empresa de medición de anuncios o DSP puede tener miles de clientes publicitarios globales que abarcan varios sectores, monedas y posibles precios de compra. Esto significa que crear y administrar una clave de agregación por anunciante probablemente no será práctico. Además, será un desafío seleccionar un valor agregado máximo y un presupuesto de agregación que puedan limitar el impacto del ruido en estos miles de anunciantes globales. En cambio, consideremos las siguientes situaciones:

Estrategia clave A

El proveedor de tecnología publicitaria decide crear y administrar una clave para todos sus clientes publicitarios. En todos los anunciantes y en todas las monedas, el rango de compras varía desde compras de bajo volumen y de alto nivel hasta compras de volumen alto y finales. Esto da como resultado la siguiente clave:

Clave (varias monedas)
Valor agregable máximo 5,000,000
Rango de valor de compra [120 - 5000000]
Estrategia clave B

El proveedor de tecnología publicitaria decide crear y administrar dos claves para todos sus clientes publicitarios. Deciden separar las claves según la moneda. En todos los anunciantes y en todas las monedas, el rango de compras varía desde compras de bajo volumen y gama alta hasta compras de volumen alto y finales. Se separan por moneda, crean 2 claves:

Clave 1 (USD) Clave 2 (CNY)
Valor agregable máximo $40,000 JPY 5,000,000
Rango de valor de compra [120 - 40,000] [15,000 - 5,000,000]

La estrategia clave B tendrá menos ruido en su resultado que la estrategia clave A, ya que los valores de moneda no se distribuyen de manera uniforme entre las monedas. Por ejemplo, considera cómo las compras denominadas en JPY y combinadas con compras denominadas en USD modificarán los datos subyacentes y generarán ruidos de salida.

Estrategia clave C

El proveedor de tecnología publicitaria decide crear y administrar cuatro claves en todos sus clientes de publicidad y separarlas por moneda x industria del anunciante:

Clave 1
(USD x anunciantes de joyas de alta gama)
Clave 2
(JPY x anunciantes de joyas refinadas)
Clave 3
(USD x anunciantes minoristas de ropa)
Clave 4
(CNY x Anunciantes minoristas de ropa)
Valor agregable máximo $40,000 JPY 5,000,000 $500 JPY 65,000
Rango de valor de compra [10,000 - 40,000] [1,250,000 - 5,000,000] [120 - 500] [15,000 - 65,000]

La estrategia clave C tendrá menos ruido en el resultado que la estrategia clave B, ya que los valores de compra del anunciante no se distribuyen de manera uniforme entre los anunciantes. Por ejemplo, considera cómo las compras de joyas de alta gama combinadas con las compras de gorras de béisbol alterarán los datos subyacentes y generará resultados ruidosos.

Considera crear valores agregados máximos compartidos y factores de escala compartidos para puntos en común entre varios anunciantes a fin de reducir el ruido en el resultado. Por ejemplo, podrías experimentar con distintas estrategias a continuación para tus anunciantes:

  • Una estrategia separada por moneda (USD, JPY, CAD, etcétera)
  • Una estrategia separada por sector del anunciante (seguros, automóviles, venta minorista, etcétera)
  • Una estrategia separada por rangos de valor de compra similares ([100], [1000], [10000], etcétera)

Mediante la creación de estrategias clave en torno a los puntos en común del anunciante, las claves y el código correspondiente son más fáciles de administrar y las relaciones señal-ruido son más altas. Experimenta con diferentes estrategias con distintos puntos en común de los anunciantes para descubrir los puntos de inflexión en la maximización del impacto del ruido en comparación con la administración del código.


Administración avanzada de valores atípicos

Consideremos una situación en la que participan dos anunciantes:

  • Anunciante A:
    • En todos los productos del sitio del anunciante A, las posibilidades de precio de compra están entre [USD 120 y USD 1,000] , para un rango de USD 880.
    • Los precios de compra se distribuyen de manera uniforme en el rango de USD 880 sin valores atípicos fuera de las dos desviaciones estándar del precio de compra promedio.
  • Anunciante B:
    • En todos los productos del sitio del anunciante B, las posibilidades de precio de compra están entre [USD 120 - USD 1,000] , para un rango de USD 880.
    • Los precios de compra se inclinan en gran medida hacia el rango de USD 120 a USD 500, y solo el 5% de las compras se producen en el rango de USD 500 a USD 1,000.

Dados los requisitos de presupuesto de contribución y la metodología con la que [se aplica el ruido](/privacy-sandbox/relevance/attribution-reporting/understanding-noise/#how-noise-is-applied) para los resultados finales, el anunciante B tendrá, de forma predeterminada, un resultado más ruidoso que el anunciante A, ya que el anunciante B tiene un mayor potencial de que los valores atípicos afecten los cálculos subyacentes.

Es posible mitigar esto con una configuración de clave específica. Prueba estrategias clave que ayudan a administrar los datos de valores atípicos y a distribuir de manera más uniforme los valores de compra en el rango de compra de la clave.

En el caso del anunciante B, podrías crear dos claves distintas para capturar dos rangos de valores de compra diferentes. En este ejemplo, la tecnología publicitaria observó que los valores atípicos aparecen por encima del valor de compra de USD 500. Intenta implementar dos claves distintas para este anunciante:

  • Estructura clave 1 : Clave que solo captura compras de entre $120 y $500 (lo cual abarca aproximadamente el 95% del volumen total de compras).
  • Estructura clave 2: Clave que solo captura las compras superiores a $500 (abarca alrededor del 5% del volumen total de compras).

Implementar esta estrategia clave debería administrar mejor la información irrelevante para el anunciante B y maximizar su utilidad a partir de los informes de resumen. Dados los nuevos rangos más pequeños, la clave A y la clave B ahora deberían tener una distribución de datos más uniforme entre cada clave respectiva que para la clave única anterior. Esto generará un menor impacto de ruido en la salida de cada clave que para la clave única anterior.