NoiseLab

À propos de ce document

En lisant cet article, vous saurez:

  • Comprendre les stratégies à créer avant de générer des rapports de synthèse.
  • Familiarisez-vous avec Noise Lab, un outil qui vous aide à comprendre les effets de différents paramètres de bruit et qui permet d'explorer et d'évaluer rapidement différentes stratégies de gestion du bruit.
Capture d'écran de Noise Lab
Noise Lab

Envoyer des commentaires

Bien que ce document résume quelques principes à utiliser avec les rapports récapitulatifs, il existe plusieurs approches de gestion du bruit qui peuvent ne pas être reflétées ici. Vos suggestions, ajouts et questions sont les bienvenus !

  • Pour faire des commentaires publics sur les stratégies de gestion du bruit, sur l'utilité ou la confidentialité de l'API (epsilon), et pour partager vos observations lors de la simulation avec Noise Lab, procédez comme suit : Commenter ce problème
  • Pour envoyer des commentaires publics sur Noise Lab (poser une question, signaler un bug, demander une fonctionnalité) : Créer un problème ici
  • Pour envoyer des commentaires publics sur un autre aspect de l'API : cliquez ici pour signaler un nouveau problème.

Avant de commencer

  1. Pour en savoir plus, consultez Attribution Reporting: rapports récapitulatifs et Présentation complète du système Attribution Reporting.
  2. Consultez les sections Comprendre le bruit et Comprendre les clés d'agrégation pour tirer le meilleur parti de ce guide.

Décisions de conception

Principe de conception de base

Il existe des différences fondamentales entre le fonctionnement des cookies tiers et celui des rapports de synthèse. L'une des principales différences est le bruit ajouté aux données de mesure dans les rapports récapitulatifs. ou la planification des rapports.

Pour accéder aux données de mesure récapitulatives avec des ratios signal sur bruit plus élevés, les plates-formes côté demande (DSP) et les fournisseurs de solutions de mesure des annonces doivent collaborer avec leurs annonceurs pour développer des stratégies de gestion du bruit. Pour développer ces stratégies, les DSP et les fournisseurs de solutions de mesure doivent prendre des décisions de conception. Ces décisions s'articulent autour d'un concept essentiel:

Bien que les valeurs de bruit proviennent de la distribution, elle ne dépend que de deux paramètres : epsilon et le budget de contribution. De plus, vous disposez d'un certain nombre d'autres contrôles qui auront un impact sur les rapports signal sur bruit de vos données de mesure de sortie.

Bien que nous nous attendions à ce qu'un processus itératif aboutisse aux meilleures décisions, chaque variante de ces décisions entraînera une implémentation légèrement différente. Par conséquent, ces décisions doivent être prises avant l'écriture de chaque itération du code (et avant la diffusion d'annonces).

Décision: Précision des dimensions

Essayer dans Noise Lab

  1. Passez en mode avancé.
  2. Dans le panneau latéral "Paramètres", recherchez "Vos données de conversion".
  3. Respectez les paramètres par défaut. Par défaut, le nombre total de conversions attribuables quotidiennement est de 1 000. Ce chiffre est d'environ 40 par bucket avec la configuration par défaut (dimensions par défaut, nombre de valeurs différentes possibles pour chaque dimension, stratégie de clé A). Notez que la valeur est de 40 dans le nombre moyen de conversions attribuables quotidiennes par BUCKET.
  4. Cliquez sur "Simuler" pour exécuter une simulation avec les paramètres par défaut.
  5. Dans le panneau latéral "Paramètres", recherchez "Dimensions". Remplacez le nom Situation géographique par Ville et remplacez le nombre de valeurs différentes possibles par 50.
  6. Observez comment cela modifie le nombre moyen de conversions attribuables par jour PAR BUCKET. Elle est maintenant beaucoup plus basse. En effet, si vous augmentez le nombre de valeurs possibles dans cette dimension sans modifier quoi que ce soit, vous augmentez le nombre total de buckets sans modifier le nombre d'événements de conversion présents dans chaque bucket.
  7. Cliquez sur "Simuler".
  8. Observez les rapports de bruit de la simulation obtenue: ils sont désormais plus élevés que ceux de la simulation précédente.

Compte tenu du principe de conception de base, les petites valeurs récapitulatives sont susceptibles d'entraîner plus de bruit que les grandes valeurs récapitulatives. Par conséquent, votre choix de configuration a une incidence sur le nombre d'événements de conversion attribués qui se retrouvent dans chaque bucket (ou clé d'agrégation), et cette quantité a un impact sur le bruit dans les rapports de synthèse des résultats finaux.

La précision des dimensions est une décision de conception qui a une incidence sur le nombre d'événements de conversion attribués au sein d'un même bucket. Voici quelques exemples de clés d'agrégation et de leurs dimensions:

  • Approche 1: une structure clé avec des dimensions approximatives: Pays x Campagne publicitaire (ou le plus grand bucket d'agrégation de campagnes) x Type de produit (sur 10 types de produits possibles)
  • Approche 2: une seule structure clé avec des dimensions précises: Ville x ID de la création x Produit (sur 100 produits possibles)

La dimension Ville est plus précise que Pays, l'ID de la création est plus précis que Campagne, tandis que Produit l'est plus que Type de produit. Par conséquent, l'approche 2 présentera un nombre d'événements (conversions) par bucket (= par clé) moins élevé dans son rapport récapitulatif que l'approche 1. Étant donné que le bruit ajouté à la sortie est agnostique par rapport au nombre d'événements dans le bucket, les données de mesure dans les rapports récapitulatifs seront plus bruyantes avec l'approche 2. Pour chaque annonceur, testez différents compromis en termes de précision dans la conception de la clé afin d'optimiser les résultats.

Décision: structures clés

Essayer dans Noise Lab

En mode simple, la structure de clé par défaut est utilisée. En mode avancé, vous pouvez tester différentes structures de clés. Il inclut des exemples de dimensions que vous pouvez modifier.

  1. Passez en mode avancé.
  2. Dans le panneau latéral "Paramètres", recherchez "Stratégie de clé". Notez que la stratégie par défaut, nommée A dans l'outil, utilise une structure de clé précise incluant toutes les dimensions: Zone géographique x ID de campagne x Catégorie de produit.
  3. Cliquez sur "Simuler".
  4. Observez les rapports de bruit de la simulation obtenue.
  5. Remplacez la stratégie de clé par B. Des commandes supplémentaires s'affichent pour vous permettre de configurer votre structure de clés.
  6. Configurez la structure de vos clés, par exemple comme suit :
    1. Nombre de structures de clés: 2
    2. Structure de clé 1 = zone géographique x catégorie de produits
    3. Structure clé 2 = ID de campagne x catégorie de produits.
  7. Cliquez sur "Simuler".
  8. Notez que vous obtenez maintenant deux rapports récapitulatifs par type d'objectif de mesure (deux pour le nombre d'achats et deux pour la valeur des achats), étant donné que vous utilisez deux structures de clés distinctes. Observez leurs rapports de bruit.
  9. Vous pouvez aussi essayer avec vos propres dimensions personnalisées. Pour ce faire, recherchez les données dont vous souhaitez effectuer le suivi : "Dimensions". Vous pouvez supprimer les exemples de dimensions et créer les vôtres à l'aide des boutons "Ajouter", "Supprimer" et "Réinitialiser" situés sous la dernière dimension.

Une autre décision de conception qui aura une incidence sur le nombre d'événements de conversion attribués dans un seul bucket concerne les structures de clés que vous décidez d'utiliser. Voici quelques exemples de clés d'agrégation:

  • Il s'agit d'une structure clé avec toutes les dimensions, que nous appelons la stratégie clé A.
  • Il s'agit de deux structures clés, chacune avec un sous-ensemble de dimensions, que nous appelons stratégie clé B.
Diagramme:

La stratégie A est plus simple, mais vous devrez peut-être regrouper (somme) les valeurs récapitulatives contenant des rapports de synthèse pour accéder à certains insights. En additionnant ces valeurs, vous additionnez également le bruit. Avec la stratégie B, les valeurs récapitulatives affichées dans les rapports récapitulatifs peuvent déjà vous fournir les informations dont vous avez besoin. Cela signifie que la stratégie B conduira probablement à de meilleurs rapports signal sur bruit que la stratégie A. Cependant, le bruit peut déjà être acceptable avec la stratégie A. Vous pouvez donc décider de privilégier la stratégie A pour plus de simplicité. Pour en savoir plus, consultez l'exemple détaillé de ces deux stratégies.

La gestion des clés est un sujet complexe. Un certain nombre de techniques élaborées peuvent être envisagées pour améliorer les rapports signal sur bruit. L'une d'elles est décrite dans la section Gestion avancée des clés.

Décision: fréquence de traitement par lot

Essayer dans Noise Lab

  1. Passez en mode simple (ou en mode avancé, les deux modes fonctionnent de la même manière en ce qui concerne la fréquence de traitement par lot).
  2. Dans le panneau latéral "Paramètres", recherchez Votre stratégie d'agrégation > Fréquence de traitement par lot. Il s'agit de la fréquence de traitement par lot des rapports agrégables traités avec le service d'agrégation dans une seule tâche.
  3. Respectez la fréquence de traitement par lot par défaut: par défaut, une fréquence de traitement par lot quotidienne est simulée.
  4. Cliquez sur "Simuler".
  5. Observez les rapports de bruit de la simulation obtenue.
  6. Définissez la fréquence de traitement par lot sur hebdomadaire.
  7. Observez les rapports de bruit de la simulation obtenue: ils sont désormais inférieurs (meilleurs) à ceux de la simulation précédente.

Une autre décision de conception qui aura une incidence sur le nombre d'événements de conversion attribués dans un seul bucket est la fréquence de traitement par lot que vous décidez d'utiliser. La fréquence de traitement par lot correspond à la fréquence à laquelle vous traitez des rapports agrégables.

Un rapport dont l'agrégation est planifiée plus fréquemment (par exemple, toutes les heures) comportera moins d'événements de conversion que le même rapport avec un calendrier d'agrégation moins fréquent (par exemple, chaque semaine). Par conséquent, le rapport horaire comprendra plus de bruit. Le rapport inclut moins d'événements de conversion que le même rapport avec un calendrier d'agrégation moins fréquent (par exemple, chaque semaine). Par conséquent, le rapport horaire présente un rapport signal sur bruit inférieur à celui du rapport hebdomadaire, tous les autres paramètres étant identiques. Testez les exigences concernant les rapports sur différentes fréquences et évaluez le rapport signal sur bruit pour chacune d'elles.

Pour en savoir plus, consultez les sections Traitement par lot et Agrégation sur des périodes plus longues.

Décision: variables de campagne ayant une incidence sur les conversions attribuables

Essayer dans Noise Lab

Bien qu'il puisse être difficile à prévoir et qu'il puisse présenter des variations importantes en plus des effets de saisonnalité, essayez d'estimer le nombre de conversions quotidiennes attribuables à la puissance la plus proche (10, 100, 1 000 ou 10 000).

  1. Passez en mode avancé.
  2. Dans le panneau latéral "Paramètres", recherchez "Vos données de conversion".
  3. Respectez les paramètres par défaut. Par défaut, le nombre total de conversions attribuables quotidiennement est de 1 000. Ce chiffre est d'environ 40 par bucket avec la configuration par défaut (dimensions par défaut, nombre de valeurs différentes possibles pour chaque dimension, stratégie de clé A). Notez que la valeur est de 40 dans le nombre moyen de conversions attribuables quotidiennes par BUCKET.
  4. Cliquez sur "Simuler" pour exécuter une simulation avec les paramètres par défaut.
  5. Observez les rapports de bruit de la simulation obtenue.
  6. Définissez maintenant le nombre total de conversions attribuables par jour sur 100. Notez que cela réduit la valeur du nombre moyen de conversions attribuables par jour PAR BUCKET.
  7. Cliquez sur "Simuler".
  8. Notez que les rapports de bruit sont désormais plus élevés, car lorsque vous avez moins de conversions par bucket, davantage de bruit est appliqué pour préserver la confidentialité.

Une distinction importante est le nombre total de conversions possibles pour un annonceur et le nombre total de conversions attribuées possibles. C'est ce dernier qui a un impact sur le bruit dans les rapports récapitulatifs. Les conversions attribuées représentent un sous-ensemble du nombre total de conversions sujettes aux variables de la campagne, telles que le budget publicitaire et le ciblage des annonces. Par exemple, vous pouvez vous attendre à un plus grand nombre de conversions attribuées pour une campagne publicitaire de 10 millions $par rapport à une campagne publicitaire de 10 000 $, toutes les autres valeurs étant égales.

Tenez compte des remarques suivantes :

  • Évaluez les conversions attribuées par rapport à un modèle d'attribution en un seul geste sur le même appareil, car elles sont prises en compte dans les rapports récapitulatifs collectés avec l'API Attribution Reporting.
  • Tenez compte à la fois du nombre du pire des scénarios et du nombre du meilleur des scénarios pour les conversions attribuées. Par exemple, tous les autres paramètres étant égaux, prenez en compte les budgets de campagne minimal et maximal possibles pour un annonceur, puis projetez les conversions attribuables pour les deux résultats comme éléments de votre simulation.
  • Si vous envisagez d'utiliser la Privacy Sandbox Android, tenez compte des conversions attribuées multiplates-formes dans le calcul.

Décision: utiliser le scaling

Essayer dans Noise Lab

  1. Passez en mode avancé.
  2. Dans le panneau latéral "Paramètres", recherchez Votre stratégie d'agrégation > Scaling. Il est défini sur Oui par défaut.
  3. Pour mieux comprendre les effets positifs du scaling sur le rapport de bruit, définissez d'abord "Scaling" sur "Non".
  4. Cliquez sur "Simuler".
  5. Observez les rapports de bruit de la simulation obtenue.
  6. Définissez le scaling sur "Yes" (Oui). Notez que Noise Lab calcule automatiquement les facteurs de scaling à utiliser en fonction des plages (valeurs moyennes et maximales) des objectifs de mesure pour votre scénario. Dans une configuration de système réelle ou d'évaluation, vous pouvez effectuer votre propre calcul des facteurs de scaling.
  7. Cliquez sur "Simuler".
  8. Notez que les rapports de bruit sont désormais inférieurs (meilleurs) dans cette deuxième simulation. En effet, vous utilisez le scaling.

Selon le principe de conception de base, le bruit ajouté est une fonction du budget de contribution.

Par conséquent, pour augmenter les rapports signal sur bruit, vous pouvez décider de transformer les valeurs collectées lors d'un événement de conversion en les ajustant en fonction du budget de contribution (et en les déscaling après l'agrégation). Utilisez la mise à l'échelle pour augmenter les rapports signal sur bruit.

Décision: nombre d'objectifs de mesure et répartition du budget axée sur la confidentialité

S'agissant du scaling, veillez à consulter la section Utiliser le scaling.

Essayer dans Noise Lab

Un objectif de mesure est un point de données distinct collecté dans les événements de conversion.

  1. Passez en mode avancé.
  2. Dans le panneau latéral "Paramètres", recherchez les données que vous souhaitez suivre : objectifs de mesure. Par défaut, vous avez deux objectifs de mesure: la valeur des achats et le nombre d'achats.
  3. Cliquez sur "Simuler" pour exécuter une simulation avec les objectifs par défaut.
  4. Cliquez sur "Supprimer". Cette action supprimera le dernier objectif de mesure (le nombre d'achats, dans ce cas).
  5. Cliquez sur "Simuler".
  6. Notez que les rapports de bruit pour la valeur d'achat sont désormais inférieurs (meilleurs) pour cette deuxième simulation. En effet, vous avez moins d'objectifs de mesure. Un objectif de mesure unique reçoit donc désormais l'intégralité du budget de contribution.
  7. Cliquez sur "Réinitialiser". Vous avez de nouveau deux objectifs de mesure: la valeur des achats et le nombre d'achats. Notez que Noise Lab calcule automatiquement les facteurs de scaling à utiliser en fonction des plages (valeurs moyennes et maximales) des objectifs de mesure pour votre scénario. Par défaut, Noise Lab répartit le budget de manière égale entre les objectifs de mesure.
  8. Cliquez sur "Simuler".
  9. Observez les rapports de bruit de la simulation obtenue. Prenez note des facteurs de scaling affichés dans la simulation.
  10. Nous allons maintenant personnaliser la répartition du budget "Confidentialité" pour obtenir de meilleurs rapports signal sur bruit.
  11. Modifiez le pourcentage de budget attribué pour chaque objectif de mesure. Compte tenu des paramètres par défaut, l'objectif de mesure 1, à savoir la valeur des achats, est bien plus étendu (entre 0 et 1 000) que l'objectif de mesure 2, à savoir le nombre d'achats (entre 1 et 1, c'est-à-dire toujours égal à 1). C'est pourquoi il a besoin de "plus d'espace pour évoluer". L'idéal serait d'attribuer plus de budget de contribution à l'objectif de mesure 1 que à l'objectif 2, afin qu'il puisse être augmenté plus efficacement (voir "Mise à l'échelle").
  12. Affectez 70% du budget à l'objectif de mesure 1. Attribuez 30% à l'objectif de mesure 2.
  13. Cliquez sur "Simuler".
  14. Observez les rapports de bruit de la simulation obtenue. Pour la valeur des achats, les rapports de bruit sont désormais nettement inférieurs (meilleurs) à ceux de la simulation précédente. En ce qui concerne le nombre d'achats, ils restent à peu près inchangés.
  15. Continuez à ajuster la répartition du budget entre les métriques. Observez l'impact sur le bruit.

Notez que vous pouvez définir vos propres objectifs de mesure personnalisés à l'aide des boutons "Ajouter", "Supprimer" et "Réinitialiser".


Si vous mesurez un point de données (objectif de mesure) pour un événement de conversion, tel que le nombre de conversions, ce point de données peut obtenir l'intégralité du budget de contribution (65 536). Si vous définissez plusieurs objectifs de mesure pour un événement de conversion, tels que le nombre de conversions et la valeur des achats, ces points de données devront partager le budget de contribution. Cela signifie que vous avez moins de marge pour augmenter vos valeurs.

Par conséquent, plus vous vous fixez d'objectifs de mesure, plus les rapports signal sur bruit sont faibles (bruit plus élevé).

Une autre décision à prendre concernant les objectifs de mesure concerne la répartition du budget. Si vous répartissez équitablement le budget de contribution entre deux points de données, chaque point de données se voit attribuer un budget de 65 536/2 = 32 768. Cette valeur peut être ou non optimale en fonction de la valeur maximale possible pour chaque point de données. Par exemple, si vous mesurez un nombre d'achats dont la valeur maximale est de 1 et que la valeur des achats est comprise entre 1 et 120, il serait utile de disposer de "plus d'espace" pour augmenter la capacité, c'est-à-dire de se voir attribuer une plus grande proportion du budget de contribution. Vous verrez si certains objectifs de mesure doivent être prioritaires sur d'autres en ce qui concerne l'impact du bruit.

Décision: gestion des anomalies

Essayer dans Noise Lab

Un objectif de mesure est un point de données distinct collecté dans les événements de conversion.

  1. Passez en mode avancé.
  2. Dans le panneau latéral "Paramètres", recherchez Votre stratégie d'agrégation > Scaling.
  3. Assurez-vous que le scaling est défini sur "Oui". Notez que Noise Lab calcule automatiquement les facteurs de scaling à utiliser en fonction des plages (valeurs moyennes et maximales) que vous avez indiquées pour les objectifs de mesure.
  4. Supposons que le plus gros achat jamais effectué s'élève à 2 000 $, mais que la plupart des achats se situent entre 10 $et 120 $. Voyons d'abord ce qui se passe si nous utilisons une approche de scaling littérale (non recommandé): saisissez 2 000 $comme valeur maximale pour purchaseValue.
  5. Cliquez sur "Simuler".
  6. Notez que les rapports de bruit sont élevés. En effet, notre facteur de scaling est actuellement calculé sur la base de 2 000 $, alors qu'en réalité la plupart des valeurs d'achat seront nettement inférieures à cette valeur.
  7. Utilisons maintenant une approche de mise à l'échelle plus pragmatique. Définissez la valeur maximale d'achat sur 120 €.
  8. Cliquez sur "Simuler".
  9. Notez que les rapports de bruit sont plus faibles (meilleurs) dans cette deuxième simulation.

Pour implémenter l'ajustement, vous devez généralement calculer un facteur de scaling basé sur la valeur maximale possible pour un événement de conversion donné (en savoir plus dans cet exemple).

Toutefois, évitez d'utiliser une valeur maximale littérale pour calculer ce facteur de scaling, car cela aggraverait vos rapports signal sur bruit. Au lieu de cela, supprimez les valeurs aberrantes et utilisez une valeur maximale pragmatique.

La gestion des anomalies est un sujet complexe. Un certain nombre de techniques élaborées peuvent être envisagées pour améliorer les rapports signal sur bruit. L'une d'elles est décrite dans la section Gestion avancée des anomalies.

Étapes suivantes

Maintenant que vous avez évalué différentes stratégies de gestion du bruit pour votre cas d'utilisation, vous êtes prêt à tester les rapports récapitulatifs en collectant des données de mesure réelles via une phase d'évaluation. Consultez les guides et les conseils pour essayer l'API.

Annexe

Présentation rapide de Noise Lab

Noise Lab vous aide à évaluer et à comparer rapidement les stratégies de gestion du bruit. Elle vous permet :

  • Identifiez les principaux paramètres qui peuvent avoir une incidence sur le bruit et leur effet.
  • Simulez l'effet du bruit sur les données de mesure des sorties en fonction de différentes décisions de conception. Ajustez les paramètres de conception jusqu'à ce que vous atteigniez un rapport signal sur bruit adapté à votre cas d'utilisation.
  • Partagez vos commentaires sur l'utilité des rapports récapitulatifs: quelles valeurs des paramètres epsilon et bruit fonctionnent pour vous ? Quelles valeurs ne fonctionnent pas ? Où sont les points d'inflexion ?

Considérez cela comme une étape de préparation. Noise Lab génère des données de mesure pour simuler les résultats d'un rapport récapitulatif en fonction de vos entrées. Elles ne sont pas conservées et ne partagent aucune donnée.

Noise Lab comporte deux modes différents:

  1. Mode simple: comprenez les principes de base des contrôles dont vous disposez sur le bruit.
  2. Mode avancé: testez différentes stratégies de gestion du bruit et déterminez celle qui offre les meilleurs rapports signal sur bruit pour vos cas d'utilisation.

Cliquez sur les boutons du menu supérieur pour basculer entre les deux modes (n° 1 dans la capture d'écran ci-dessous).

Mode simple
  • En mode simple, vous pouvez contrôler les paramètres (disponibles sur la gauche, n° 2 dans la capture d'écran ci-dessous) comme Epsilon et voir leur impact sur le bruit.
  • Chaque paramètre est associé à une info-bulle (un bouton "?"). Cliquez dessus pour afficher une explication de chaque paramètre (n° 3 dans la capture d'écran ci-dessous).
  • Pour commencer, cliquez sur le bouton "Simulate" (Simuler) et observez le résultat (n° 4 dans la capture d'écran ci-dessous).
  • La section "Output" (Sortie) donne diverses informations. Certains éléments sont signalés par un point d'interrogation (?) Prenez le temps de cliquer sur chaque point d'interrogation (?) pour afficher une explication des différentes informations.
  • Dans la section "Output" (Sortie), cliquez sur le bouton "Details" (Détails) pour afficher une version développée de la table (n° 5 dans la capture d'écran ci-dessous).
  • Sous chaque table de données de la section de sortie, une option permet de télécharger la table pour une utilisation hors connexion. De plus, en bas à droite, une option permet de télécharger toutes les tables de données (n° 6 dans la capture d'écran ci-dessous).
  • Testez différents paramètres dans la section "Paramètres", puis cliquez sur "Simuler" pour voir leur impact sur la sortie :
    Bruit
    Interface Noise Lab pour le mode simple
    .
Mode avancé
  • En mode avancé, vous disposez d'un contrôle accru sur les paramètres. Vous pouvez ajouter des objectifs de mesure et des dimensions personnalisés (n° 1 et n° 2 sur la capture d'écran ci-dessous).
  • Faites défiler la page plus bas dans la section "Paramètres" et consultez l'option "Stratégie de clé". Cela permet de tester différentes structures de clés (n° 3 dans la capture d'écran ci-dessous).
    • Pour tester différentes structures de clés, définissez la stratégie clé sur "B".
    • Saisissez le nombre de structures de clés différentes que vous souhaitez utiliser (la valeur par défaut est "2")
    • Cliquez sur "Generate Key Structures" (Générer des structures de clés)
    • Des options vous permettent de spécifier vos structures de clés en cochant les cases à côté des clés que vous souhaitez inclure pour chaque structure de clés
    • Cliquez sur "Simuler" pour afficher le résultat.
      Le mode avancé propose des commandes pour les objectifs de mesure et les dimensions à suivre, encadrées dans la barre latérale.
      Interface Noise Lab pour le mode avancé.
      Le mode avancé est également une option de stratégie clé dans la section "Paramètres" de la barre latérale.
      Interface Noise Lab pour le mode avancé.

Métriques de bruit

Concept fondamental

Du bruit est ajouté pour protéger la confidentialité des utilisateurs.

Une valeur de bruit élevée indique que les buckets/clés sont creux et contiennent des contributions provenant d'un nombre limité d'événements sensibles. Cette opération est effectuée automatiquement par Noise Lab, qui permet aux individus de "se cacher dans la foule" ou, en d'autres termes, protège la confidentialité de ces individus limités en ajoutant davantage de bruit.

Une valeur faible indique que la configuration des données a été conçue de telle sorte que les individus peuvent déjà "se cacher dans la foule". Cela signifie que les buckets contiennent des contributions provenant d'un nombre suffisant d'événements pour garantir la protection de la confidentialité des utilisateurs.

Cette affirmation s'applique à la fois à l'erreur moyenne en pourcentage (APE) et à la RMSRE_T (racine carrée de l'erreur relative quadratique moyenne avec seuil).

APE (erreur moyenne en pourcentage)

L'APE correspond au rapport entre le bruit et le signal, à savoir la valeur réelle du résumé.p> Des valeurs APE faibles signifient de meilleurs rapports signal sur bruit.

Formule

Pour un rapport récapitulatif donné, l'APE est calculé comme suit:

L'équation pour APE. Des valeurs absolues sont requises, car le bruit peut être négatif.

True est la véritable valeur récapitulative. L'APE correspond à la moyenne du bruit sur chaque valeur récapitulative réelle, calculée sur l'ensemble des entrées d'un rapport récapitulatif. Dans Noise Lab, ce nombre est ensuite multiplié par 100 pour obtenir un pourcentage.

Avantages et inconvénients

Les buckets de taille inférieure ont un impact disproportionné sur la valeur finale de l'APE. Cela pourrait être trompeur lors de l'évaluation du bruit. C'est pourquoi nous avons ajouté une autre métrique, RMSRE_T, conçue pour atténuer cette limitation de l'APE. Consultez les exemples pour en savoir plus.

Coder

Examinez le code source pour le calcul APE.

RMSRE_T (racine carrée de l'erreur relative quadratique moyenne avec un seuil)

La RMSRE_T (racine carrée de l'erreur relative quadratique moyenne avec seuil) est une autre mesure du bruit.

Interpréter RMSRE_T

Des valeurs RMSRE_T faibles signifient de meilleurs rapports signal sur bruit.
Par exemple, si un rapport de bruit acceptable pour votre cas d'utilisation est de 20 % et que la valeur RMSRE_T est de 0,2, vous pouvez être sûr que les niveaux de bruit se situent dans la plage acceptable.

Formule

Pour un rapport récapitulatif donné, la RMSRE_T est calculée comme suit:

Formule
L'équation de RMSRE_T. Des valeurs absolues sont requises, car le bruit peut être négatif.
Avantages et inconvénients

La RMSRE_T est un peu plus complexe à maîtriser que l'APE. Cependant, il présente certains avantages qui le rendent, dans certains cas, plus adapté que l'APE pour analyser le bruit dans les rapports récapitulatifs:

  • RMSRE_T est plus stable. « T » est un seuil. La valeur "T" permet d'accorder moins de poids dans le calcul de la RMSRE_T aux ensembles qui présentent moins de conversions et qui sont donc plus sensibles au bruit en raison de leur petite taille. Avec T, la métrique ne fait pas de pic sur les buckets comportant peu de conversions. Si T est égal à 5, une valeur de bruit aussi faible que 1 sur un ensemble avec 0 conversion ne sera pas affichée comme étant beaucoup plus que 1. Au lieu de cela, il sera plafonné à 0,2, ce qui équivaut à 1/5, puisque T est égal à 5. En accordant moins de pondération aux buckets plus petits, qui sont donc plus sensibles au bruit, cette métrique est plus stable et permet de comparer plus facilement deux simulations.
  • RMSRE_T facilite l'agrégation. Connaître la RMSRE_T de plusieurs buckets, ainsi que leur nombre réel, vous permet de calculer la RMSRE_T de leur somme. Cela vous permet également d'optimiser la valeur RMSRE_T pour ces valeurs combinées.

Bien que l'agrégation soit possible pour APE, la formule est assez compliquée, car elle implique la valeur absolue de la somme des bruits de Laplace. Cela rend l'optimisation APE plus difficile.

Coder

Examinez le code source pour le calcul RMSRE_T.

Exemples

Rapport récapitulatif avec trois segments:

  • bucket_1 = bruit: 10, trueSummaryValue: 100
  • bucket_2 = bruit: 20, trueSummaryValue: 100
  • bucket_3 = bruit: 20, trueSummaryValue: 200

APE = (0,1 + 0,2 + 0,1) / 3 = 13%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14 

Rapport récapitulatif avec trois segments:

  • bucket_1 = bruit: 10, trueSummaryValue: 100
  • bucket_2 = bruit: 20, trueSummaryValue: 100
  • bucket_3 = bruit: 20, trueSummaryValue: 20

APE = (0,1 + 0,2 + 1) / 3 = 43%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

Rapport récapitulatif avec trois segments:

  • bucket_1 = bruit: 10, trueSummaryValue: 100
  • bucket_2 = bruit: 20, trueSummaryValue: 100
  • bucket_3 = bruit: 20, trueSummaryValue: 0

APE = (0,1 + 0,2 + infini) / 3 = infini

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

Gestion avancée des clés

Une DSP ou une entreprise de mesure des performances des annonces peut compter des milliers de clients publicitaires dans le monde, couvrant plusieurs secteurs, devises et prix d'achat potentiels. Cela signifie que la création et la gestion d'une clé d'agrégation par annonceur seront probablement très peu pratiques. De plus, il sera difficile de sélectionner une valeur agrégable et un budget d'agrégation maximal pouvant limiter l'impact du bruit sur ces milliers d'annonceurs mondiaux. Considérons plutôt les scénarios suivants:

Stratégie clé A

Le fournisseur de technologie publicitaire décide de créer et de gérer une clé pour tous ses clients publicitaires. Pour tous les annonceurs et toutes les devises, la gamme d'achats varie, des achats haut de gamme à faible volume aux achats bas de gamme et à volume élevé. Le résultat est le suivant:

Clé (plusieurs devises)
Valeur agrégable maximale 5 000 000
Plage de la valeur des achats [120 - 5000000]
Stratégie clé B

Le fournisseur de technologie publicitaire décide de créer et de gérer deux clés pour tous ses clients publicitaires. Il décide de séparer les clés par devise. Pour tous les annonceurs et toutes les devises, la gamme d'achats varie, des achats de produits haut de gamme à faible volume aux achats bas de gamme et à volume élevé. En les séparant par devise, ils créent deux clés:

Clé 1 (USD) Clé 2 (¥)
Valeur agrégable maximale 40 000 $ 5 000 000 ¥
Plage de la valeur des achats [120-40 000] [15 000 - 5 000 000]

Le résultat de la stratégie clé B sera moins bruit que celui de la stratégie clé A, car les valeurs des devises ne sont pas réparties de manière uniforme entre les différentes devises. Par exemple, imaginons que les achats libellés en ¥ mélangés à ceux libellés en USD modifient les données sous-jacentes, ce qui génère du bruit dans la sortie.

Stratégie clé C

Le fournisseur de technologie publicitaire décide de créer et de gérer quatre clés pour tous ses clients publicitaires, et de les séparer par secteur d'activité (devise et annonceur) :

Clé 1
(USD x annonceurs de bijoux haut de gamme)
Clé 2
(¥ x annonceurs de bijoux haut de gamme)
Clé 3
(USD x annonceurs faisant la promotion de marchands de vêtements)
Clé 4
(¥ x annonceurs vendant des vêtements)
Valeur agrégable maximale 40 000 $ 5 000 000 ¥ 500 € 65 000 ¥
Plage de la valeur des achats [10 000 – 40 000] [1 250 000 - 5 000 000] [120 - 500] [15 000 – 65 000]

La stratégie clé C présentera moins de bruit dans son résultat que la stratégie clé B, car les valeurs d'achat des annonceurs ne sont pas réparties de manière uniforme entre les annonceurs. Par exemple, réfléchissez à la manière dont les achats de bijoux haut de gamme et les achats de casquettes de base-ball altèrent les données sous-jacentes et génèrent du bruit.

Envisagez de créer des valeurs agrégées maximales et des facteurs de scaling partagés pour les points communs entre plusieurs annonceurs afin de réduire le bruit dans le résultat. Par exemple, vous pouvez tester différentes stratégies pour vos annonceurs:

  • Une stratégie séparée par devise (USD, ¥, CAD, etc.)
  • Une stratégie séparée par secteur de l'annonceur (assurance, automobile, commerce, etc.)
  • Une stratégie séparée par des plages de valeurs d'achat similaires ([100], [1000], [10000], etc.)

En créant des stratégies clés autour des points communs des annonceurs, les clés et le code correspondant sont plus faciles à gérer et les rapports signal sur bruit deviennent plus élevés. Testez différentes stratégies avec des points communs entre annonceurs pour découvrir des points d'inflexion permettant de maximiser l'impact du bruit plutôt que la gestion du code.


Gestion avancée des anomalies

Imaginons un scénario pour deux annonceurs:

  • Annonceur A:
    • Pour l'ensemble des produits proposés sur le site de l'annonceur A, le prix d'achat peut se situer entre [120 € et 1 000 €] , soit une fourchette de 880 €.
    • Les prix d'achat sont répartis équitablement sur la fourchette de 880 $, sans aucune valeur aberrante en dehors de deux écarts types par rapport au prix d'achat médian.
  • Annonceur B:
    • Sur l'ensemble des produits proposés sur le site de l'annonceur B, le prix d'achat peut se situer entre [120 € et 1 000 €] , soit une fourchette de 880 €.
    • Les prix d'achat sont fortement orientés vers la fourchette comprise entre 120 et 500 $, sachant que seulement 5% des achats sont effectués entre 500 et 1 000 $.

Compte tenu des exigences de budget de contribution et de la méthodologie avec laquelle le [bruit est appliqué](/privacy-sandbox/relevance/attribution-reporting/understanding-noise/#how-noise-is-applied) aux résultats finaux, l'annonceur B générera par défaut des résultats plus bruyants que l'annonceur A, car il y a plus de chances que des anomalies aient un impact sur les calculs sous-jacents.

Il est possible d'atténuer ce problème avec une configuration de clé spécifique. Testez les stratégies de clé qui permettent de gérer les données aberrantes et de répartir plus équitablement les valeurs d'achat sur la plage d'achats de la clé.

Pour l'annonceur B, vous pouvez créer deux clés distinctes afin de capturer deux plages de valeurs d'achat différentes. Dans cet exemple, la technologie publicitaire a constaté que des anomalies semblent supérieures à la valeur d'achat de 500 $. Essayez d'implémenter deux clés distinctes pour cet annonceur:

  • Structure de clé 1 : clé qui ne capture que les achats compris entre 120 $et 500 $ (couvrant environ 95% du volume total des achats).
  • Structure de clé 2: clé qui ne capture que les achats supérieurs à 500 $ (couvrant environ 5% du volume total des achats).

La mise en œuvre de cette stratégie clé devrait permettre de mieux gérer le bruit pour l'annonceur B et de maximiser son utilité à partir des rapports récapitulatifs. Compte tenu des nouvelles plages plus petites, la distribution des données pour les clés A et B devrait désormais être plus uniforme sur chacune des clés que pour la clé unique précédente. L'impact sur le bruit dans la sortie de chaque clé est ainsi réduit par rapport à la clé précédente.