Classificazione degli argomenti

Leggi come vengono dedotti gli argomenti, come vengono assegnati ai browser degli utenti e come gli utenti possono controllare il loro elenco di argomenti.

Stato implementazione

Cos'è un argomento?

Un argomento, nell'API Topics, è un argomento a cui un utente è interessato, come evidenziato dai siti web che visita.

Gli argomenti sono un indicatore che aiuta le piattaforme di tecnologia pubblicitaria a selezionare annunci pertinenti. A differenza dei cookie di terze parti, queste informazioni vengono condivise senza rivelare ulteriori informazioni sull'utente stesso o sulla sua attività di navigazione.

L'API Topics consente a terze parti, ad esempio le piattaforme ad tech, di osservare e accedere ad argomenti di interesse per un utente. Ad esempio, l'API potrebbe suggerire l'argomento "Fibra e arti tessili" a un utente che visita il sito web knitting.example.

L'elenco di argomenti utilizzati dall'API Topics è pubblico, selezionato da una persona, leggibile e progettato per evitare categorie sensibili. Questo è l'elenco attuale, che si espanderà nel tempo. L'elenco è strutturato come una tassonomia. Gli argomenti possono essere generali o più specifici. Ad esempio, Food & Drink è una categoria generica, con una sottocategoria Cooking & Recipes. Le sottocategorie possono essere ulteriormente suddivise in altre sottocategorie.

Una simile tassonomia degli argomenti deve trovare un compromesso tra utilità e privacy. Se gli argomenti sono troppo specifici, potrebbero essere utilizzati per identificare un singolo utente. Se sono troppo generiche, non sono utili per la selezione di pubblicità o altri contenuti.

La tassonomia degli argomenti è strutturata tenendo presenti due requisiti fondamentali:

  • Supportare la pubblicità basata sugli interessi
  • Mantieni gli utenti al sicuro e proteggi la loro privacy

Questo suggerisce diverse domande. Ad esempio:

  • Qual è il modo migliore per l'API di dedurre gli argomenti di interesse per un utente in base alla sua attività di navigazione, preservando al contempo la sua privacy?
  • Come potrebbe essere strutturata la tassonomia per renderla più utile?
  • Quali elementi specifici dovrebbe includere la tassonomia?

In che modo l'API deduce gli argomenti di un sito

Gli argomenti derivano da un modello di classificazione che mappa i nomi host dei siti web a zero o più argomenti. L'analisi di informazioni aggiuntive (come URL completi o contenuti delle pagine) potrebbe consentire di visualizzare annunci più pertinenti, ma potrebbe anche ridurre la privacy.

Il modello di classificatore per la mappatura dei nomi host agli argomenti è disponibile pubblicamente e, come nota l'spiegatore, è possibile visualizzare gli argomenti per un sito tramite gli strumenti per sviluppatori del browser. Si prevede che il modello si evolverà e migliorerà nel tempo e verrà aggiornato periodicamente; la frequenza di questo approccio è ancora in fase di valutazione.

Solo i siti che includono codice che chiama l'API Topics sono inclusi nella cronologia di navigazione idonea per i calcoli della frequenza degli argomenti, mentre i chiamanti dell'API ricevono solo gli argomenti che hanno osservato. In altre parole, i siti non sono idonei per i calcoli della frequenza degli argomenti senza il sito o un servizio incorporato che chiama l'API.

Inoltre, un chiamante può ricevere solo gli argomenti "visti" dal suo codice. Pertanto, se il codice di un altro utente ha registrato un argomento, ad esempio /Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks, per il browser di un utente e il tuo codice non ha causato la registrazione dell'argomento nel browser di quell'utente, non sarai in grado di venire a conoscenza di quell'argomento di interesse per il browser di quell'utente quando chiami l'API dal tuo codice incorporato. Tieni presente che, poiché l'API ora include i predecessori osservati, l'esempio precedente, /Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks, causerebbe anche l'osservazione di Autos & Vehicles e Motor Vehicles.

Gli argomenti restituiti per un utente vengono ricalcolati per un chiamante in base al sito di primo livello. Ad esempio, se adtech.example richiede gli argomenti dell'utente il giorno news-a.example, poi il giorno news-b.example e poi il giorno news-c.example, gli argomenti restituiti verranno ricalcolati su ciascun sito. Questo significa che è probabile che un chiamante riceva argomenti diversi per un utente su siti di primo livello diversi, poiché gli (massimo) tre argomenti restituiti per un utente vengono scelti in modo casuale tra i primi cinque nelle ultime tre epoche (con una probabilità del 5% di ottenere un argomento casuale). Ciò rende più difficile per un chiamante identificare un utente in base agli argomenti, poiché è probabile che questi siano diversi tra i diversi siti di primo livello (anche per lo stesso utente, chiamante ed epoca).

Il modello del classificatore

Gli argomenti vengono selezionati manualmente per 50.000 domini principali e questa selezione viene utilizzata per addestrare il classificatore. Questo elenco è disponibile in override_list.pb.gz, disponibile all'indirizzo chrome://topics-internals/ nel modello attuale nella scheda Categoria di classificazione. Le associazioni dominio-argomento nell'elenco vengono utilizzate dall'API al posto dell'output del modello stesso.

Pagina chrome://topics-internals con il riquadro Classificatore selezionato.
Nel riquadro Classificatore della pagina chrome://topics-internals sono elencati la versione del modello, il relativo percorso e gli argomenti associati a ciascun host elencato.

Per eseguire il modello direttamente, consulta la guida di TensorFlow all'esecuzione di un modello.

Per esaminare il file override_list.pb.gz, devi prima decomprimerlo:

gunzip -c override_list.pb.gz > override_list.pb

Utilizza protoc per ispezionarlo come testo:

protoc --decode_raw < override_list.pb > output.txt

Su GitHub è disponibile una tassonomia completa di argomenti con ID.

Feedback o input sul modello di classificatore

Esistono diversi canali per fornire feedback sull'API Topics. Per feedback sul modello di classificatore, ti consigliamo di inviare un problema su GitHub o rispondere a un problema esistente. Ad esempio:

Come vengono selezionati i cinque argomenti più apprezzati dall'utente

L'API restituisce un argomento per ogni epoca, fino a un massimo di tre. Se vengono restituiti tre, sono inclusi gli argomenti relativi all'epoca corrente e ai due precedenti.

  1. Alla fine di ogni epoca, il browser compila un elenco di pagine che soddisfano i seguenti criteri:
    • La pagina è stata visitata dall'utente durante questo epoca.
    • La pagina include codice che chiama document.browsingTopics().
    • L'API è stata abilitata (ad esempio, non è stata bloccata dall'utente o tramite un'intestazione della risposta).
  2. Il browser, sul dispositivo dell'utente, utilizza il modello di classificazione fornito dall'API Topics per mappare il nome host di ogni pagina a un elenco di argomenti.
  3. Il browser accumula l'elenco di argomenti.
  4. Il browser genera un elenco dei cinque argomenti più apprezzati in base alla frequenza.

Il metodo document.browsingTopics() restituisce quindi un argomento casuale tra i primi cinque per ogni epoca, con una probabilità del 5% che uno di questi possa essere scelto in modo casuale dall'intera tassonomia degli argomenti. In Chrome, gli utenti possono anche rimuovere singoli argomenti o cancellare la cronologia di navigazione per ridurre il numero di argomenti restituiti dall'API. Gli utenti possono anche disattivare l'API.

Puoi visualizzare le informazioni sugli argomenti osservati durante l'epoca attuale dalla pagina chrome://topics-internals.

In che modo l'API decide quali chiamanti possono vedere quali argomenti

I chiamanti dell'API ricevono solo gli argomenti che hanno osservato di recente e gli argomenti per un utente vengono aggiornati una volta ogni epoca. Ciò significa che l'API fornisce una finestra temporale continua in cui un determinato chiamante può ricevere determinati argomenti.

La tabella riportata di seguito illustra un esempio (anche se non realisticamente piccolo) di un'ipotetica cronologia di navigazione per un utente durante un'unica epoca, mostra gli argomenti associati ai siti che ha visitato e i chiamanti dell'API presenti su ciascun sito (le entità che chiamano document.browsingTopics() nel codice JavaScript incluso nel sito).

Sito Argomenti Chiamanti API sul sito
yoga.example Fitness adtech1.esempio adtech2.esempio
knitting.example Artigianato adtech1.example
escursioni-vacanze.esempio Fitness, viaggi e trasporti adtech2.example
esempio-abbigliamento-fai da te Artigianato, moda e stile [nessuno]

Alla fine dell'epoca (attualmente una settimana) l'API Topics genera gli argomenti principali del browser per la settimana.

  • adtech1.example può ora ricevere gli argomenti "Fitness" e "Artigianato", poiché li ha osservati su yoga.example e anche su knitting.example.
  • adtech1.example non è idoneo a ricevere l'argomento "Viaggi e trasporti" per questo utente perché non è presente su nessun sito visitato di recente dall'utente e associato a questo argomento.
  • adtech2.example ha visto gli argomenti "Fitness" e "Viaggi e trasporti ", ma non ha visto l'argomento "Artigianato".

L'utente ha visitato diy-clothing.example, che contiene l'argomento "Moda e stile", ma non ci sono state chiamate all'API Topics su quel sito. A questo punto, significa che l'argomento "Moda e stile" non verrebbe restituito dall'API per alcun chiamante.

Nella seconda settimana, l'utente visita un altro sito:

Sito Argomenti Chiamanti API sul sito
sewing.example Artigianato adtech2.example

Inoltre, il codice di adtech2.example viene aggiunto a diy-clothing.example:

Sito Argomenti Chiamanti API sul sito
esempio-abbigliamento-fai da te Artigianato, moda e stile adtech2.example

Oltre a "Fitness" e "Viaggi e trasporti" dalla settimana 1, questo significa che adtech2.example ora potrà ricevere gli argomenti "Artigianato" e "Moda e stile", ma non fino all'epoca successiva, la settimana 3. In questo modo, le terze parti non possono ottenere maggiori informazioni sul passato di un utente (in questo caso, un interesse per la moda) rispetto ai cookie.

Dopo altre due settimane, "Fitness" e "Viaggi e trasporti" potrebbero non essere più presenti nell'elenco di argomenti idonei di adtech2.example se l'utente non visita alcun sito con questi argomenti che include il codice di adtech2.example.

Controlli utente, trasparenza e disattivazione

Gli utenti dovrebbero essere in grado di comprendere lo scopo dell'API Topics, riconoscere cosa viene detto al riguardo, sapere quando l'API è in uso e disporre di controlli per abilitarla o disabilitarla.

La tassonomia leggibile dell'API consente agli utenti di conoscere e controllare gli argomenti che potrebbero essere suggeriti per loro dal loro browser. Gli utenti possono rimuovere gli argomenti che non vogliono che l'API Topics condivida con inserzionisti o publisher e potrebbero essere disponibili dei controlli per informare l'utente dell'API e mostrare come attivarla o disattivarla. Chrome fornisce informazioni e impostazioni per l'API Topics all'indirizzo chrome://settings/adPrivacy. Inoltre, gli argomenti non sono disponibili per i chiamanti dell'API in modalità di navigazione in incognito e vengono cancellati quando la cronologia di navigazione viene cancellata.

L'elenco di argomenti restituiti sarà vuoto se:

  • L'utente disattiva l'API Topics tramite le impostazioni del browser all'indirizzo chrome://settings/adPrivacy.
  • L'utente ha cancellato i propri argomenti (tramite le impostazioni del browser all'indirizzo chrome://settings/adPrivacy) o cancellato i cookie.
  • Il browser è in modalità di navigazione in incognito.

Nell'articolo esplicativo vengono forniti ulteriori dettagli sugli obiettivi relativi alla privacy e su come l'API cerca di raggiungerli.

Disattivazione del sito

Oltre alla possibilità dell'utente di disattivare gli argomenti, puoi disattivare Topics per il tuo sito o per le pagine al suo interno. La guida per gli sviluppatori spiega come fare.

Utilizzo dell'API Topics su siti web con prebid.js

Come indicato nella release di Prebid 7, la community ha sviluppato attivamente un'integrazione con l'API Topics tramite un nuovo modulo. Questo modulo è stato unito a dicembre 2022.

Scopri di più qui:

Passaggi successivi

Interagisci e condividi il tuo feedback