Framework de tests de charge du service d'agrégation

N'hésitez pas à nous faire part de vos commentaires sur ce document pendant que nous nous préparons à l'ajouter à notre référentiel d'instructions publiques.

Nous encourageons les technologies publicitaires à exécuter des tests de charge sur la totalité du trafic de production:

  1. Les technologies publicitaires doivent accéder à la mesure de l'attribution des conversions en utilisant l'API Attribution Reporting comme cas d'utilisation pour la création de rapports.
  2. La technologie publicitaire doit prendre des décisions de conception tout en minimisant le bruit (référence: décisions de conception modélisées).
  3. Lors des tests, les technologies publicitaires doivent suivre le nombre de tâches exécutées par jour (par exemple, les tâches par annonceur), une estimation de la répartition du volume d'événements de conversion et du nombre de clés agrégées en entrée par tâche de traitement (consultez le paramètre de joboutput_domain_blob_prefix dans la documentation de l'API Aggregation Service) et une estimation du nombre moyen d'événements de conversion par entrée.
  4. Pour les tests, les technologies publicitaires doivent rechercher le type d'instance recommandé dans le tableau des conseils de dimensionnement en fonction de la taille de tâche attendue (c'est-à-dire le volume du rapport, la taille du domaine) et la taille de leur service d'agrégation déployé en conséquence. Référence: Conseils de dimensionnement pour le service agrégé sur AWS
  5. Les technologies publicitaires doivent exécuter des tâches d'agrégation pour les tests de charge.

Objectifs

Ces conseils sont spécifiques à la mesure globale de l'attribution des conversions et incluent des instructions de configuration clés destinées aux technologies publicitaires pour:

  • Estimez les attentes de charge pour la mesure globale de l'attribution des conversions.
  • En optimisant la configuration de leurs clés pour les performances et le bruit en fonction des dimensions et des objectifs qu'ils souhaitaient mesurer, ainsi que de la taille et de la segmentation de leurs annonceurs.

Prérequis

Ce guide s'adresse au public de technologies publicitaires. Avant de suivre les étapes suivantes, consultez notre documentation sur l'utilisation du bruit, les décisions de conception des rapports récapitulatifs et testez l'atelier sur le bruit pour une configuration optimale.

Étapes

1. Stratégie de configuration initiale des clés d'agrégation

Déterminez le nombre de structures clés (c'est-à-dire un ensemble de dimensions) différentes dont vous avez besoin en fonction de votre type d'entreprise et de vos objectifs. Notez que l'optimisation de votre structure de clés peut aider à réduire le bruit dans les rapports.

Le nombre d'annonceurs
Par exemple, supposons que vous ayez 1 000 annonceurs.

Les similitudes entre vos annonceurs
Les similitudes doivent être évaluées en fonction du volume de conversions, des valeurs de conversion relatives et des caractéristiques générales de l'annonceur. Plus vous pouvez les regrouper, plus vos résultats seront affinés (en raison de la variance moindre des valeurs de sortie) et, par conséquent, moins l'impact du bruit sera faible. Pour en savoir plus, consultez la section Gestion avancée des clés. Par exemple, une technologie publicitaire peut segmenter ses annonceurs par secteur, dépenses et volume de conversions comme suit:

  • Secteur (assurance, bijouterie, vente au détail, croissance, etc.)
  • Dépenses (par exemple: < 50 000 $/trimestre, 50 à 150 000 $/trimestre, 150 000 $ à 250 000 $/trimestre)
  • Volume de conversions (faible, moyen, élevé)

Nombre de structures de clés agrégées à créer
Par exemple, 27 (3 x 3 x 3) : 3 secteurs, 3 types de dépenses et 3 groupes pour les valeurs de conversion.

2. Identifier les dimensions clés d'agrégation

Identifiez ensuite les dimensions importantes dont vous souhaitez effectuer le suivi à la fois pour les impressions et les conversions afin d'estimer le nombre de clés côté source et déclencheur.

Pour chaque structure de clé d'agrégation, les dimensions importantes dont vous devez effectuer le suivi pour les impressions vous aideront à déterminer le nombre de clés côté source. Les dimensions dépendent du type d'annonceur mentionné ci-dessus (secteur, dépenses, conversion, etc.). Les exemples suivants permettent d'expliquer les dimensions:

  • Structure de clé 1: (Secteur = assurances, dépenses = moins de 50 000, volume de conversions = faible)

    • R : Quatre dimensions : "Campagne" (par exemple, 50 possibilités), groupe d'annonces (ex.: 20 possibilités), type d'appareil (par exemple, 5 possibilités), données géographiques (ex.: 50 possibilités)
      1. Combinaisons de dimensions possibles = 50 x 20 x 5 x 50 = 250 000. Il s'agit du nombre de combinaisons dimensionnelles possibles pour les clés côté source pour la structure de clés 1.
      2. Il faut réserver 18 bits (18 bits = 262 144 combinaisons possibles).
  • Structure de clé 2: (Secteur = assurances, dépenses = moins de 50 000, volume de conversions = moyen)

    • R : Quatre dimensions : "Campagne" (par exemple, 30 possibilités), groupe d'annonces (ex.: 80 possibilités), type d'annonce (ex.: 3 possibilités), données géographiques (ex.: 50 possibilités).
      1. Combinaisons de dimensions possibles = 30 x 80 x 3 x 50 = 360 000. Il s'agit du nombre de combinaisons de dimensions possibles ou de clés côté source possibles pour la structure de clés 2.
      2. Il faut réserver 19 bits (19 bits) = 524 288 combinaisons possibles.)
  • Structure de clé 3: répétition (planifiez de la même manière pour toutes vos structures de clés)

Pour chaque structure de clé d'agrégation, les dimensions importantes dont vous devez suivre les conversions vous aideront à déterminer les clés secondaires du déclencheur. Exemple :

  • Structure de clé 1: (Secteur = assurances, dépenses = moins de 50 000, volume de conversions = faible)

    • R : Deux dimensions : la catégorie du produit (par exemple, 100 possibilités), type de conversion (par exemple, 5 possibilités)
      1. Combinaisons de dimensions possibles = 100 x 5 = 500
      2. Vous devez réserver 9 bits (9 bits = 512 combinaisons possibles).
  • Structure de clé 2: (Secteur = assurances, dépenses = moins de 50 000, volume de conversions = moyen)

    • R : Trois dimensions : catégorie du produit (par exemple, 50 possibilités), Type de produit (10 possibilités), Type de conversion (3 possibilités)
      1. Combinaisons de dimensions possibles = 50 x 10 x 3 = 1 500
      2. Il faut réserver 11 bits (11 bits = 2 048 combinaisons possibles).
  • Structure de clé 3: répétition (planifiez de la même manière pour toutes vos structures de clés)

Estimations pour les clés agrégées

  • Structure de clé 1: 250 000 clés d'impression x 500 clés de conversion = 125 000 000 clés
  • Structure de clé 2: 360 000 clés d'impression x 1 500 clés de conversion = 540 000 000 clés
  • Structure de clés 3: (planifiez également toutes vos structures de clés)
  • Répéter pour chaque structure de clé
  • Nombre maximal de clés : 540 000 000 clés (pour toutes les structures de clés) Il faut réserver 30 bits (30 bits = 1,07 milliard de combinaisons possibles)

Volume de conversions anticipé

Pour chaque structure de clé d'agrégation, le volume anticipé peut être expliqué à l'aide des exemples suivants:

  • Structure de clé 1: (Secteur = assurances, dépenses = moins de 50 000, volume de conversions = faible)
    • A: Anticipez que la structure de clé 1 constituera environ 500 000 $de dépenses publicitaires au cours du prochain trimestre,pour un CPM moyen de 8 $. Anticipez qu'il en résultera 62 500 000 impressions à enregistrer.
    • Anticipez que le taux moyen d'impression et de conversion que la structure de clé 1 représentera au cours du prochain trimestre sera de 0,08 %. Il faudrait donc capturer 50 000 conversions attribuées. Pour chaque conversion, mesurez la valeur des achats et le nombre d'achats.
  • Structure de clé 2: (Secteur = assurances, dépenses = moins de 50 000, volume de conversions = moyen)
    • R: La clé 2 représente environ 800 000 $ de dépenses au cours du prochain trimestre,pour un CPM moyen de 10 $. Anticipez que cela entraînera l'enregistrement de 80 000 000 d'impressions.
    • Anticipez que le taux moyen d'impression et de conversion que la clé 2 représentera au cours du prochain trimestre sera de 0,03125 %. Il faudrait donc capturer 25 000 conversions attribuées. Pour chaque conversion, mesurez la valeur des achats et le nombre d'achats.
  • Répéter pour chaque structure de clé

Fréquence de diffusion et de traitement par lot des rapports (lot par annonceur)**

Pour chaque structure de clé d'agrégation, vous devez fournir des rapports sur les conversions de manière récurrente. Nous vous recommandons de traiter les technologies publicitaires par lot par annonceur (pour séparer les données par rapport de manière plus claire et une agrégation plus efficace) et d'utiliser le champ shared_info.scheduled_report_time du rapport pour le traitement par lot.

  • R: Toutes les heures
  • B: Tous les jours
  • C: Toutes les semaines

Remarques

  • Pour le traitement par lot par annonceur, vérifiez les contrats de niveau de service avec les annonceurs.
  • Un traitement par lot plus fréquent entraînera un bruit par lot plus élevé. (Voir Décision : Fréquence de traitement par lot)

  • Pour éviter les erreurs dues à un traitement par lot incorrect, assurez-vous que les lots utilisent le champ scheduled_report_time, et non report arrival time. Par exemple, si vous effectuez un lot toutes les heures, votre lot pour 11h ne doit inclure que les rapports avec scheduled_report_time entre 10h et 11h, et non ceux qui ont été reçus entre 10h et 11h avec un scheduled_report_time différent (par exemple, 09:00).

Estimation du volume de rapports

  • Structure de clé 1: 50 000 conversions attribuées / 2 160 (rapports horaires, heures par trimestre) = 24 rapports récapitulatifs par heure et par annonceur (24 x 1 000 annonceurs = 24 000 rapports de synthèse)
  • Structure de clé 2: 25 000 conversions attribuées / 2 160 (rapports horaires, heures par trimestre) = 12 rapports de synthèse par heure et par annonceur (12 x 1 000 annonceurs = 12 000 rapports de synthèse)
  • Structure de clé 3: Répéter
  • Nombre total de rapports de synthèse par heure = 24 rapports de synthèse pour la structure de clé 1 + 12 rapports de synthèse pour la structure de clé 2 + ... = ... par heure et par annonceur

Résumé des commentaires

Comprendre les estimations suivantes provenant des technologies publicitaires nous aide à planifier les fonctionnalités et les améliorations afin de prendre en charge l'échelle requise par les technologies publicitaires. Nous vous invitons à nous communiquer les informations suivantes. Pour en savoir plus, consultez nos conseils de dimensionnement pour le service d'agrégation sur AWS:

  • Nombre maximal de clés de domaine d'entrée (clés à agréger) par tâche de service d'agrégation
  • Volume maximal des rapports d'entrée par job (conversions attribuées)
  • Estimation des contributions par rapport (paires clés/valeurs dans un rapport)
  • Estimation de la répartition des conversions attribuées par job
  • Répartition estimée des clés de domaine dans une tâche
  • Nombre estimé d'emplois par heure/jour/semaine