Présentation de l'API Topics

L'API Topics permet d'utiliser la publicité ciblée par centres d'intérêt sans avoir à suivre les sites consultés par un utilisateur.

État de l'implémentation

Qu'est-ce que l'API Topics ?

L'API Topics est un mécanisme de Privacy Sandbox conçu pour préserver la confidentialité tout en permettant à un navigateur de partager des informations avec des tiers sur les centres d'intérêt d'un utilisateur. Elles permettent d'utiliser la publicité ciblée par centres d'intérêt sans avoir à effectuer le suivi des sites consultés par un utilisateur.

La publicité ciblée par centres d'intérêt est un concept clé de l'API Topics. Il s'agit d'une forme de publicité personnalisée dans laquelle une annonce est sélectionnée pour un utilisateur en fonction de ses centres d'intérêt, déduits des sites qu'il a consultés récemment. Cette approche est différente de la publicité contextuelle, qui vise à faire correspondre les annonces au contenu de la page consultée par l'utilisateur.

La publicité ciblée par centres d'intérêt peut aider les annonceurs (sites qui souhaitent promouvoir leurs produits ou services) et les éditeurs (sites qui utilisent des annonces pour monétiser leur contenu):

  • La publicité ciblée par centres d'intérêt peut aider les annonceurs à toucher des clients potentiels.
  • La publicité ciblée par centres d'intérêt peut compléter les informations contextuelles afin d'aider les éditeurs à utiliser la publicité pour financer des sites Web.

L'API Topics fournit une nouvelle forme de publicité ciblée par centres d'intérêt qui utilise des thèmes (catégories d'intérêt) attribués à un navigateur en fonction de l'activité récente des utilisateurs. Ces rubriques peuvent compléter les informations contextuelles pour vous aider à sélectionner les publicités appropriées.

Fonctionnement

Auparavant, des cookies tiers et d'autres mécanismes ont été utilisés pour suivre le comportement de navigation des utilisateurs sur les sites afin d'identifier les centres d'intérêt. Ces mécanismes sont en cours d'abandon.

Avec l'API Topics, le navigateur observe et enregistre les sujets qui semblent intéresser l'utilisateur en fonction de son activité de navigation. Ces informations sont enregistrées sur l'appareil de l'utilisateur. L'API Topics peut ensuite permettre aux appelants d'API (comme les plates-formes ad tech) d'accéder aux thèmes qui intéressent un utilisateur, mais sans révéler d'informations supplémentaires sur son activité de navigation.

Observation des thèmes ancêtres

Depuis Chrome 114, lorsqu'un appelant observe un sujet pour un utilisateur sur une page, le navigateur considère également l'appelant comme ayant observé tous les ancêtres de ce sujet.

Par exemple, si le navigateur enregistre qu'un appelant observe Shopping/Apparel/Footwear/Boots pour un utilisateur, les ancêtres de ce sujet sont également considérés comme ayant été observés: Shopping/Apparel/Footwear, Shopping/Apparel et Shopping.

Auparavant, pour qu'un appelant soit considéré par le navigateur comme ayant observé (par exemple) Shopping/Apparel, ce sujet spécifique devait avoir été renvoyé par l'API en tant que sujet observé. Cela signifie que si Shopping/Apparel est observé pour un appelant pour un utilisateur sur une page et Shopping/Apparel/Footwear/Boots sur une autre, l'API considérera Shopping/Apparel comme ayant été observé sur les deux pages.

Époques

Bien entendu, l'API Topics doit s'assurer que les sujets qui vous intéressent sont à jour. Le navigateur déduit les thèmes d'un utilisateur en fonction de son activité de navigation au cours d'une période appelée epoch, soit une semaine. Chaque utilisateur a ses propres epochs (par utilisateur), et l'heure de début initiale est aléatoire. Le thème de chaque epoch est choisi de manière aléatoire parmi les cinq thèmes principaux associés à l'utilisateur pour cette période. Pour renforcer davantage la confidentialité et garantir la représentation de tous les thèmes, il y a 5% de chances que le thème soit sélectionné au hasard parmi tous les thèmes possibles dans une taxonomie de centres d'intérêt.

L'API Topics comporte trois tâches principales:

  • Mappez l'activité du navigateur et les sujets qui vous intéressent. Avec la conception actuelle de l'API Topics, les thèmes sont déduits des noms d'hôte des pages que l'utilisateur visite. Par exemple, le thème déduit pour un site Web sur les aquariums pourrait être /Animaux et animaux de compagnie/Animaux de compagnie/Poissons et aquariums.
  • Calculez les principaux thèmes d'un utilisateur en fonction de son activité de navigation récente.
  • Fournissez des mécanismes permettant d'accéder aux thèmes qui intéressent l'utilisateur afin de l'aider à sélectionner les annonces appropriées.

L'API Topics fournit des thèmes lisibles et compréhensibles, ce qui permet de proposer des contrôles pertinents aux utilisateurs.

Mode de sélection et de sélection des thèmes

Les thèmes sont sélectionnés dans une taxonomie composée de catégories hiérarchiques (par exemple, /Arts et divertissements/Musique et audio/Soul et R&B) et /Marchés commerciaux et industriels/Agriculture et sylviculture. Ces thèmes ont été sélectionnés par Chrome pour les premiers tests, mais l'objectif est que la taxonomie devienne une ressource gérée par des contributeurs de confiance de l'écosystème. Elle doit être suffisamment courte pour que de nombreux navigateurs d'utilisateurs soient associés à chaque thème. Actuellement, le nombre de thèmes est de 349, mais nous estimons que le nombre final de thèmes se situe entre quelques centaines et quelques milliers.

Pour éviter les catégories sensibles, les sujets doivent être publics, sélectionnés manuellement et rester à jour. La classification initiale proposée pour être testée par Chrome a été sélectionnée manuellement pour exclure des catégories généralement considérées comme sensibles, telles que l'origine ethnique ou l'orientation sexuelle.

Pour 10 000 sites principaux, la mise en œuvre de l'API Topics dans Chrome utilise une liste de remplacement organisée manuellement et accessible au public pour mapper les noms d'hôte aux thèmes. Pour les autres sites, l'API Topics utilise un modèle de machine learning pour déduire les thèmes à partir des noms d'hôte.

L'implémentation de l'API Topics par Chrome télécharge un fichier TensorFlow Lite représentant le modèle, afin qu'il puisse être utilisé localement sur l'appareil de l'utilisateur.

Vous pouvez accéder au fichier de modèle TensorFlow Lite et aux sujets déduits pour les noms d'hôte à partir de chrome://topics-internals.

Le schéma ci-dessous illustre un exemple simplifié illustrant comment l'API Topics peut aider une plate-forme de technologie publicitaire à sélectionner une annonce appropriée. L'exemple suppose que le navigateur de l'utilisateur dispose déjà d'un modèle permettant de mapper les noms d'hôte des sites Web aux sujets.

Diagramme illustrant les étapes du cycle de vie de l'API Topics, de la visite d'un utilisateur à l'affichage d'une annonce
Le schéma du cycle de vie de l'API Topics présente les étapes des actions de l'API d'un point de vue général. Afficher une version plus grande

Les appelants de l'API ne reçoivent que les thèmes qu'ils ont observés

L'un des objectifs de conception de l'API Topics est de permettre la publicité ciblée par centres d'intérêt sans partager d'informations avec plus d'entités qu'il n'est actuellement possible avec les cookies tiers. L'API Topics est conçue pour que des thèmes ne puissent être renvoyés que pour les appelants de l'API qui les ont déjà observés, dans un délai limité. Un appelant d'API est considéré comme ayant observé un sujet pour un utilisateur s'il a appelé la méthode document.browsingTopics() dans le code inclus sur un site que l'API Topics a mappé sur ce sujet.

L'API ne renvoie que les thèmes observés par l'appelant au cours des trois dernières epochs. Cela permet d'éviter que les informations sur l'utilisateur ne soient partagées avec plus d'entités que les technologies remplacées par l'API (y compris les cookies tiers).

Le nombre de thèmes affichés dépend du nombre de thèmes que l'appelant de l'API a précédemment observés et du nombre de thèmes disponibles pour l'utilisateur (par exemple, le nombre de semaines de données accumulées). Entre zéro et trois thèmes peuvent être renvoyés, car un thème peut être indiqué pour chacune des trois epochs récentes.

Pour en savoir plus sur l'utilisation et le test de l'API Topics, consultez le guide du développeur de l'API Topics.

Comment l'API réduit-t-elle le fingerprinting

L'API Topics fournit plusieurs mécanismes permettant de s'assurer qu'il est difficile de réidentifier un nombre important d'utilisateurs sur les sites qui n'utilisent que cette API:

  • Étant donné que la classification des thèmes ne fournit pas de précision générale, chaque thème est censé être associé à un grand nombre d'utilisateurs. En effet, le nombre d'utilisateurs par thème est garanti, car 5% du temps, le thème renvoyé est aléatoire.
  • Les thèmes sont renvoyés de manière aléatoire parmi les cinq premiers thèmes de l'utilisateur.
  • Si un utilisateur visite fréquemment le même site (chaque semaine, par exemple), le code qui y est exécuté peut apprendre un nouveau sujet par semaine au maximum.
  • Chaque site reçoit des thèmes différents pour un même utilisateur au cours d'une même epoch. Il y a une faible probabilité sur cinq que le thème renvoyé pour un utilisateur sur un site corresponde à celui proposé sur un autre site. Il est donc plus difficile de déterminer s'il s'agit du même utilisateur.
  • Les sujets sont mis à jour pour un utilisateur une fois par semaine, ce qui limite la fréquence à laquelle les informations peuvent être partagées. En d'autres termes, l'API contribue à limiter le fingerprinting en ne fournissant pas trop de mises à jour des sujets.
  • Un thème n'est renvoyé que pour un appelant d'API ayant précédemment observé le même sujet pour le même utilisateur. Cette approche permet de limiter le potentiel des entités d'en apprendre davantage (ou de partager) des informations sur les centres d'intérêt des utilisateurs qu'elles n'ont pas observées de première main.

Comment l'API a répondu aux préoccupations concernant FLoC

La phase d'évaluation de FLoC en 2021 a reçu de nombreux commentaires de la part des contributeurs de l'ad tech et de l'écosystème Web. Plus particulièrement, certains craignaient que les cohortes FLoC ne puissent être utilisées comme surface d'empreinte digitale pour identifier les utilisateurs, ou qu'ils ne révèlent l'association d'un utilisateur à une catégorie sensible. Des appels ont également été faits afin de rendre le FLoC plus transparent et plus compréhensible pour les utilisateurs.

L'API Topics a été conçue en tenant compte de ces commentaires. Elle vise à explorer d'autres façons de soutenir la publicité ciblée par centres d'intérêt, avec une meilleure transparence, des garanties de confidentialité renforcées et une approche différente pour les catégories sensibles.

Étapes suivantes

En savoir plus sur les thèmes et leur fonctionnement

Si vous êtes développeur de technologie publicitaire, testez l'API Topics et participez-y. Pour accéder à des ressources plus détaillées, consultez le guide du développeur.

Interagir et partager des commentaires