Dopasowywanie danych własnych i przekazywanych przez użytkowników

Dopasowywanie danych własnych i przekazywanych przez użytkowników (UPDM) łączy zebrane przez Ciebie dane własne o użytkowniku (np. informacje z Twoich witryn, aplikacji lub sklepów stacjonarnych) z aktywnością tego samego zalogowanego użytkownika we wszystkich danych reklam Google, w tym z danymi należącymi do Google i zarządzanymi przez tę firmę. Obejmuje to dane kupowane w ramach usług Google Marketing Platform (GMP), np. w YouTube kupowane za pomocą Display & Video 360. Inne usługi GMP, które nie są własnością Google ani nie są przez nią obsługiwane, nie są obsługiwane.

Aby kwalifikować się do dopasowywania danych własnych i przekazywanych przez użytkowników, zdarzenie reklamy musi być powiązane z zalogowanym użytkownikiem w danych reklam Google.

Ten dokument opisuje funkcję dopasowywania danych użytkownika oraz zawiera wskazówki dotyczące jej konfiguracji i użytkowania.

Omówienie karty Połączenia

Aby uzyskać cenne statystyki reklamowe, często trzeba połączyć dane z różnych źródeł. Stworzenie własnego rozwiązania tego problemu wymaga znacznych nakładów czasu i zasobów inżynieryjnych. Strona Połączenia w Centrum danych reklam upraszcza ten proces, ponieważ zawiera przejrzysty interfejs, który krok po kroku prowadzi Cię przez proces importowania, przekształcania i dopasowywania danych reklam w BigQuery. Dzięki temu możesz używać tych danych w zapytaniach w Centrum danych reklam lub w innych usługach, które odczytują informacje z BigQuery. Wzbogacanie zapytań za pomocą danych własnych może zwiększać komfort klientów i jest bardziej odporne na ogólnobranżowe zmiany sposobów śledzenia reklam.

Strona Połączenia zawiera narzędzia, które umożliwiają szyfrowanie i udostępnianie informacji umożliwiających identyfikację partnerom w sposób zapewniający ochronę prywatności. Po wybraniu kolumn zawierających dane osobowe Centrum danych reklam szyfruje te dane, aby mogły je eksportować lub odczytywać tylko osoby, które mają do tego uprawnienia. Ustalenie, które dane własne są potrzebne do pomiaru lub aktywacji, może być trudne, dlatego Centrum danych reklam udostępnia obszerną listę wstępnie zdefiniowanych przypadków użycia, a potem prowadzi Cię przez cały proces wyodrębniania, przetwarzania i wczytywania danych. Możesz tworzyć różne typy połączeń, ale w tym dokumencie zakładamy, że korzystasz z strony Połączenia na potrzeby dopasowywania danych przekazywanych przez użytkowników.

Obsługiwane źródła danych własnych

Dane możesz importować z tych źródeł:

  • BigQuery
  • Cloud Storage
  • Bezpieczny protokół FTP (sFTP)
  • Płatek śniegu
  • MySQL
  • PostgreSQL
  • Amazon Redshift
  • Amazon S3

jest dostępne tylko w zasobach reklamowych należących do Google i zarządzanych przez Google, więc zbliżające się wycofanie plików cookie innych firm nie będzie miało na nie wpływu; Jest bardziej odporne na zmiany zachodzące w branży niż dane innych firm, dzięki czemu może zapewniać bardziej szczegółowe statystyki, co może prowadzić do większego zaangażowania klientów.

Poznaj terminologię

  • Połączenie z danymi użytkownika: skonfiguruj połączenie z danymi użytkownika, aby importować i dopasowywać dane, planować importowanie danych, przekształcać dane i dopasowywać dane reklam za pomocą identyfikatora użytkownika. Zdarzenie reklamy musi być powiązane z zalogowanym użytkownikiem w danych reklam Google. Wymaga wielu projektów Google Cloud.
  • Połączenie z danymi własnymi: skonfiguruj połączenie z danymi własnymi jako narzędzie do przygotowywania danych, aby zaplanować importowanie danych i ich przekształcanie bez korzystania z zaawansowanych funkcji UPDM. Ten typ połączenia wymaga tylko jednego projektu Google Cloud.
  • Źródło danych: połączona usługa, zaimportowany plik lub integracja z usługami innych firm, np. BigQuery.
  • Miejsce docelowe: przypadek użycia, czyli zwykle usługa Google lub jej funkcja, w której aktywowane są zaimportowane dane, np. dopasowywanie danych przekazywanych przez użytkowników w Centrum danych reklam.
  • Projekt administracyjny: projekt Google Cloud zawierający Twoje zastrzeżone dane reklamowe w nieprzetworzonym formacie.
  • Zbiór danych wyjściowych: zbiór danych BigQuery, do którego Centrum danych reklam zapisuje dane. Domyślnie jest to zbiór danych w projekcie administracyjnym. Aby zmienić je na inne konto Google Cloud, przeczytaj artykuł Konfigurowanie kont usługi.

Podsumowanie

  1. Konfigurowanie przetwarzania i dopasowywania danych
  2. Pozyskiwanie i dopasowywanie danych własnych
    • Ty formatujesz i przesyłasz dane własne do zbioru danych BigQuery. Najprostszą konfigurację możesz przeprowadzić w projekcie administracyjnym. Możesz jednak użyć dowolnego własnego zbioru danych BigQuery.
    • Ty inicjujesz żądanie dopasowania danych, tworząc połączenie i ustawiając harmonogram importu.
    • Google łączy dane z Twojego projektu z danymi Google, które zawierają identyfikator użytkownika Google i zaszyfrowane dane przekazane przez użytkownika, aby tworzyć i aktualizować tabele dopasowań.
    • Zobacz przetwarzanie danych własnych.
  3. Trwałe zapytania w Centrum danych reklam oparte na dopasowanych danych

Więcej informacji o wymaganiach dotyczących prywatności

Zbieranie danych o klientach

Jeśli korzystasz z dopasowywania danych przekazywanych przez użytkowników, musisz przesłać dane własne. Mogą to być informacje zebrane przez Ciebie w Twoich witrynach, aplikacjach, sklepach stacjonarnych lub wszelkie informacje, które klient udostępnił Ci bezpośrednio.

Musisz:

  • zadbać o to, aby w polityce prywatności znalazła się informacja o tym, że dane klientów udostępniasz innym firmom, które świadczą usługi w Twoim imieniu, a jeśli wymaga tego prawo, uzyskać zgodę na udostępnianie danych w ten sposób;
  • do przesyłania danych klientów używać wyłącznie interfejsów lub API zatwierdzonych przez Google;
  • przestrzegać wszystkich obowiązujących przepisów i regulacji prawnych, w tym wszelkich regulacji wewnętrznych i wytycznych branżowych;

Potwierdzenie samodzielnie uzyskanej zgody użytkowników

Aby móc używać w Centrum danych reklam danych własnych, musisz potwierdzić, że masz uzyskaną prawidłową zgodę użytkowników z Europejskiego Obszaru Gospodarczego na udostępnianie danych Google, która została otrzymana w sposób określony przez politykę w zakresie zgody użytkownika z UEzasady Centrum danych reklam. To wymaganie obowiązuje w przypadku każdego konta Centrum danych reklam, a swoje potwierdzenie uzyskania zgody użytkowników musisz aktualizować za każdym razem, gdy przesyłasz nowe dane własne. Potwierdzenie to może przekazać w imieniu całego konta dowolny jego użytkownik.

Pamiętaj, że te same reguły dotyczące zapytań kierowanych do usług Google, które obowiązują w przypadku zapytań analitycznych, mają zastosowanie do zapytań UPDM. Na przykład, gdy tworzysz tabelę odpowiedników, nie możesz wykonywać zapytań dotyczących użytkowników z Europejskiego Obszaru Gospodarczego i obejmujących różne usługi.

Aby dowiedzieć się, jak potwierdzić w Centrum danych reklam uzyskanie zgody użytkowników, zapoznaj się z artykułem Wymagania dotyczące uzyskiwania zgody użytkowników w Europejskim Obszarze Gospodarczym.

Rozmiar danych

Aby chronić prywatność użytkowników, dopasowywanie danych przekazywanych przez użytkowników wymusza te wymagania dotyczące rozmiaru danych:

  • Lista użytkowników musi zawierać co najmniej 1000 rekordów.
  • Każda pomyślna aktualizacja tabeli dopasowań musi obejmować minimalną liczbę nowo dopasowanych użytkowników. Takie działanie jest podobne do sprawdzania różnic.
  • Lista nie może przekraczać maksymalnej liczby rekordów. Aby dowiedzieć się więcej o maksymalnym limicie danych, skontaktuj się z przedstawicielem Google.

Konfigurowanie przetwarzania danych

Zanim zaczniesz, musisz skonfigurować konto Centrum danych reklam, aby utworzyć połączenia danych, które umożliwią Ci utworzenie potoku dopasowywania danych. Wystarczy, że wykonasz te kroki tylko raz.

Na stronie Połączenia kliknij Rozpocznij konfigurację, aby otworzyć kreatora konfiguracji konta na etapie włączania UPDM.

Otwórz Połączenia

Jakie uprawnienia są przyznawane w przypadku BigQuery i Cloud Storage?

Jeśli skonfigurujesz UPDM do użycia z BigQuery lub Cloud Storage, skorzystaj z tego dokumentu referencyjnego, aby dowiedzieć się, jakie uprawnienia są przyznawane kontom usługi Centrum danych reklam.

BigQuery

Konto usługi Data Fusion
Cel Konto usługi Data Fusion służy do wyświetlania listy pól źródłowych w interfejsie Centrum danych reklam.
Format service-some-number@gcp-sa-datafusion.iam.gserviceaccount.com
Wymagany dostęp
BigQuery Data Viewer
roles/bigquery.dataViewer
w przypadku określonych zbiorów danych w projektach źródła danychdocelowych;
Storage Admin
roles/storage.admin
w ramach projektu źródła danych lub w dedykowanym zasobniku na dane.
Konto usługi Dataproc
Cel Konto usługi Dataproc odpowiada za uruchamianie potoków danych w tle.
Format some-number-compute@developer.gserviceaccount.com
Wymagany dostęp
BigQuery Data Viewer
roles/bigquery.dataViewer
w przypadku określonych zbiorów danych w projektach źródła danychdocelowych;
BigQuery Data Editor
roles/bigquery.dataEditor
w przypadku konkretnych zbiorów danych w projekcie Docelowy.
BigQuery Job User
roles/bigquery.jobUser
w przypadku projektów źródła danychmiejsca docelowego.
Storage Admin
roles/storage.admin
w przypadku projektów źródła danychmiejsca docelowego lub dedykowanego zasobnika danych.
Konto usługi UPDM
Cel Konto usługi UPDM służy do uruchamiania zadania dopasowywania.
Format service-some-number@gcp-sa-adsdataconnector.iam.gserviceaccount.com
Wymagany dostęp
BigQuery Data Viewer
roles/bigquery.dataViewer
w przypadku projektu Docelowy.
BigQuery Job User
roles/bigquery.jobUser
w przypadku projektu Docelowy.

Cloud Storage

Konto usługi Data Fusion
Cel Konto usługi Data Fusion służy do wyświetlania listy pól źródłowych w interfejsie Centrum danych reklam.
Format service-some-number@gcp-sa-datafusion.iam.gserviceaccount.com
Wymagany dostęp
Storage Object Viewer
roles/storage.objectViewer
w przypadku konkretnych zasobników w projekcie źródła danych.
BigQuery Data Viewer
roles/bigquery.dataViewer
w ramach projektu źródła danych lub w dedykowanym zasobniku na dane.
Storage Admin
roles/storage.admin
w ramach projektu źródła danych lub w dedykowanym zasobniku na dane.
Konto usługi Dataproc
Cel Konto usługi Dataproc odpowiada za uruchamianie potoków danych w tle.
Format some-number-compute@developer.gserviceaccount.com
Wymagany dostęp
Storage Admin
roles/storage.admin
w przypadku projektów źródła danychmiejsca docelowego lub dedykowanego zasobnika danych.
BigQuery Job User
roles/bigquery.jobUser
w przypadku projektu Docelowy.
Konto usługi UPDM
Cel Konto usługi UPDM służy do uruchamiania zadania dopasowywania.
Format service-some-number@gcp-sa-adsdataconnector.iam.gserviceaccount.com
Wymagany dostęp
BigQuery Data Viewer
roles/bigquery.dataViewer
w przypadku projektu Docelowy.
BigQuery Job User
roles/bigquery.jobUser
w przypadku projektu Docelowy.

Inne źródła danych

Nie jest to konieczne w przypadku innych źródeł danych.

Przetwarzanie i dopasowywanie danych własnych

Formatowanie danych na potrzeby wprowadzania

Aby dane były prawidłowo dopasowywane, muszą spełniać te wymagania dotyczące formatowania:

  • W przypadku, gdy w opisie pola podano taką informację, musisz przesłać dane za pomocą szyfrowania SHA256.
  • Pola wejściowe muszą być sformatowane jako ciągi znaków. Jeśli na przykład używasz funkcji skrótu SHA256 z BigQuery z funkcją kodowania Base16 (TO_HEX), użyj tej transformacji: TO_HEX(SHA256(user_data)).
  • UPDM obsługuje kodowanie Base16 i Base64. Musisz dostosować kodowanie danych własnych do dekodowania używanego w zapytaniu Centrum danych reklam. Jeśli zmienisz kodowanie danych własnych, musisz zaktualizować zapytanie Centrum danych reklam, aby dekodowanie odbywało się z tej samej podstawy. W podanych niżej przykładach użyto kodowania Base16.

Identyfikator użytkownika

  • Zwykły tekst
  • Haszowanie: brak

E-mail

  • usuwanie odstępów na początku i na końcu ciągu,
  • Używaj tylko małych liter.
  • Każdy adres e-mail musi zawierać domenę, np. gmail.com lub hotmail.co.jp
  • usuwanie akcentów, np. zamienianie è, é, ê lub ë na e;
  • usunąć wszystkie kropki (.) poprzedzające nazwę domeny w adresach e-mail w domenach gmail.com i googlemail.com.
  • Kodowanie haszujące: Base16 zakodowany SHA256

Prawidłowy: TO_HEX(SHA256("jeffersonloveshiking@gmail.com"))

Nieprawidłowy: TO_HEX(SHA256("JéffersonLôvesHiking@gmail.com"))

Telefon

  • Usuwanie spacji
  • Format E.164 – na przykład: w Stanach Zjednoczonych: +14155552671, w Wielkiej Brytanii: +442071838750.
  • Usuń wszystkie znaki specjalne oprócz „+” przed kodem kraju.
  • Kodowanie haszujące: Base16 zakodowany SHA256

Prawidłowy: TO_HEX(SHA256("+18005550101"))

Nieprawidłowy: TO_HEX(SHA256("(800) 555-0101"))

Imię

  • Usuwanie spacji
  • Używaj tylko małych liter.
  • Usuń wszystkie przedrostki, np. Panu, Pani Dr
  • Nie usuwaj znaków diakrytycznych, takich jak è, é, ê lub ë.
  • Kodowanie haszujące: Base16 zakodowany SHA256

Prawidłowy: TO_HEX(SHA256("daní"))

Nieprawidłowy: TO_HEX(SHA256("Daní"))

Nazwisko

  • Usuwanie spacji
  • Używaj tylko małych liter.
  • Usuń wszystkie przyrostki, na przykład Jr., Sr., 2nd, 3rd, II, III, PHD, MD
  • Nie usuwaj znaków diakrytycznych, takich jak è, é, ê lub ë.
  • Kodowanie haszujące: Base16 zakodowany SHA256

Prawidłowy: TO_HEX(SHA256("delacruz"))

Nieprawidłowy: TO_HEX(SHA256("de la Cruz, Jr."))

Kraj

  • Podaj kod kraju, nawet jeśli wszyscy Twoi klienci pochodzą z tego samego kraju
  • Nie szyfruj danych kraju
  • Używaj kodów kraju w formacie ISO 3166-1 alfa-2.
  • Haszowanie: brak

Prawidłowy: US

Nieprawidłowy: United States of America lub USA

Kod pocztowy

  • Nie szyfruj danych kodu pocztowego
  • Dopuszczalne są zarówno amerykańskie, jak i międzynarodowe kody pocztowe
  • W przypadku Stanów Zjednoczonych:
    • Dozwolone są 5-cyfrowe kody, np. 94043.
    • Format 5-cyfrowy z 4-cyfrowym rozszerzeniem też jest dozwolony, np. 94043-1351 lub 940431351.
  • W przypadku pozostałych krajów:
    • Nie wymaga formatowania (nie trzeba zmieniać znaków na małe ani usuwać spacji i znaków specjalnych)
    • Nie dodawaj rozszerzeń kodu pocztowego
  • Haszowanie: brak

Sprawdzanie poprawności hasha i kodowanie danych

Aby mieć pewność, że dane są prawidłowo sformatowane, możesz użyć tych skryptów weryfikacji hasha.

JavaScript

Base16

/**
 * @fileoverview Provides the hashing algorithm for User-Provided Data Match, as
 * well as some valid hashes of sample data for testing.
*/

async function hash(token) {
  // Removes leading or trailing spaces and converts all characters to lowercase.
  const formattedToken = token.trim().toLowerCase();
  // Hashes the formatted string using the SHA-256 hashing algorithm.
  const hashArrayBuffer = await crypto.subtle.digest(
      'SHA-256', (new TextEncoder()).encode(formattedToken));
  // Converts the hash buffer to a hexadecimal string.
  return Array.from(new Uint8Array(hashArrayBuffer))
      .map((b) => b.toString(16).padStart(2, '0'))
      .join('');
}

function main() {
  // Expected hash for test@gmail.com:
  // 87924606b4131a8aceeeae8868531fbb9712aaa07a5d3a756b26ce0f5d6ca674
  hash('test@gmail.com').then(result => console.log(result));

  // Expected hash for +18005551212:
  // 61d9111bed3e6d9cfc1bc3b5cb35a402687c4f1546bee061a2bd444fbdd64c44
  hash('+18005551212').then(result => console.log(result));

  // Expected hash for John:
  // 96d9632f363564cc3032521409cf22a852f2032eec099ed5967c0d000cec607a
  hash('John').then(result => console.log(result));

  // Expected hash for Doe:
  // 799ef92a11af918e3fb741df42934f3b568ed2d93ac1df74f1b8d41a27932a6f
  hash('Doe').then(result => console.log(result));
}

main()

Base64

/**
 * @fileoverview Provides the hashing algorithm, as well as some valid hashes of
 * sample data for testing.
*/

async function hash(token) {
  // Removes leading or trailing spaces and converts all characters to lowercase.
  const formattedToken = token.trim().toLowerCase();
  // Hashes the formatted string using the SHA-256 hashing algorithm.
  const hashBuffer = await crypto.subtle.digest(
      'SHA-256', (new TextEncoder()).encode(formattedToken));
  // Converts the hash buffer to a base64-encoded string and returns it.
  const base64Str = btoa(String.fromCharCode(...new Uint8Array(hashBuffer)));
  return base64Str;
}

function main() {
  // Expected hash for test@gmail.com:
  // h5JGBrQTGorO7q6IaFMfu5cSqqB6XTp1aybOD11spnQ=
  hash('test@gmail.com').then(result => console.log(result));

  // Expected hash for +18005551212:
  // YdkRG+0+bZz8G8O1yzWkAmh8TxVGvuBhor1ET73WTEQ=
  hash('+18005551212').then(result => console.log(result));

  // Expected hash for John: ltljLzY1ZMwwMlIUCc8iqFLyAy7sCZ7VlnwNAAzsYHo=
  hash('John').then(result => console.log(result));

  // Expected hash for Doe: eZ75KhGvkY4/t0HfQpNPO1aO0tk6wd908bjUGieTKm8=
  hash('Doe').then(result => console.log(result));
}

main()

Python

Base16

"""Provides the hashing algorithm, as well as some valid hashes of sample data for testing.

Supports: Python 2, Python 3

Sample hashes:

  - Email 'test@gmail.com': 87924606b4131a8aceeeae8868531fbb9712aaa07a5d3a756b26ce0f5d6ca674
  - Phone '+18005551212':   61d9111bed3e6d9cfc1bc3b5cb35a402687c4f1546bee061a2bd444fbdd64c44
  - First name 'John':      96d9632f363564cc3032521409cf22a852f2032eec099ed5967c0d000cec607a
  - Last name 'Doe':        799ef92a11af918e3fb741df42934f3b568ed2d93ac1df74f1b8d41a27932a6f
"""

import base64
import hashlib

def updm_hash(token):
# Generates a SHA-256 hash of the input token after normalization.
  return hashlib.sha256(token.strip().lower().encode('utf-8')).hexdigest()

def print_updm_hash(token):
# Prints the SHA-256 hash and the original token.
  print('Hash: "{}"\t(Token: {})'.format(updm_hash(token), token))

def main():
# Hashes and prints sample tokens.
  print_updm_hash('test@gmail.com')
  print_updm_hash('+18005551212')
  print_updm_hash('John')
  print_updm_hash('Doe')

if __name__ == '__main__':
  main()

Base64

"""Provides the hashing algorithm, as well as some valid hashes of sample data for testing.

Supports: Python 2, Python 3

Sample hashes:

  - Email 'test@gmail.com': h5JGBrQTGorO7q6IaFMfu5cSqqB6XTp1aybOD11spnQ=
  - Phone '+18005551212':   YdkRG+0+bZz8G8O1yzWkAmh8TxVGvuBhor1ET73WTEQ=
  - First name 'John':      ltljLzY1ZMwwMlIUCc8iqFLyAy7sCZ7VlnwNAAzsYHo=
  - Last name 'Doe':        eZ75KhGvkY4/t0HfQpNPO1aO0tk6wd908bjUGieTKm8=
"""

import base64
import hashlib

def hash(token):
# Generates a base64-encoded SHA-256 hash of a normalized input string.
  return base64.b64encode(
      hashlib.sha256(
          token.strip().lower().encode('utf-8')).digest()).decode('utf-8')

def print_hash(token, expected=None):
# Computes and displays the hash of a token, with optional validation.
  hashed = hash(token)

  if expected is not None and hashed != expected:
    print(
        'ERROR: Incorrect hash for token "{}". Expected "{}", got "{}"'.format(
            token, expected, hashed))
    return

  print('Hash: "{}"\t(Token: {})'.format(hashed, token))

def main():
# Tests the hash function with sample tokens and expected results.
  print_hash(
      'test@gmail.com', expected='h5JGBrQTGorO7q6IaFMfu5cSqqB6XTp1aybOD11spnQ=')
  print_hash(
      '+18005551212', expected='YdkRG+0+bZz8G8O1yzWkAmh8TxVGvuBhor1ET73WTEQ=')
  print_hash('John', expected='ltljLzY1ZMwwMlIUCc8iqFLyAy7sCZ7VlnwNAAzsYHo=')
  print_hash('Doe', expected='eZ75KhGvkY4/t0HfQpNPO1aO0tk6wd908bjUGieTKm8=')

if __name__ == '__main__':
  main()

Przeczytaj

Base16

/*
Provides the hashing algorithm, as well as some valid hashes of sample data for testing.

Sample hashes:

  - Email 'test@gmail.com': 87924606b4131a8aceeeae8868531fbb9712aaa07a5d3a756b26ce0f5d6ca674
  - Phone '+18005551212':   61d9111bed3e6d9cfc1bc3b5cb35a402687c4f1546bee061a2bd444fbdd64c44
  - First name 'John':      96d9632f363564cc3032521409cf22a852f2032eec099ed5967c0d000cec607a
  - Last name 'Doe':        799ef92a11af918e3fb741df42934f3b568ed2d93ac1df74f1b8d41a27932a6f
*/
package main

import (
  "crypto/sha256"
  "fmt"
  "strings"
)

// Hash hashes an email, phone, first name, or last name into the correct format.
func Hash(token string) string {
  formatted := strings.TrimSpace(strings.ToLower(token))
  hashed := sha256.Sum256([]byte(formatted))
  encoded := fmt.Sprintf("%x", hashed[:])
  return encoded
}

// PrintHash prints the hash for a token.
func PrintHash(token string) {
  fmt.Printf("Hash: \"%s\"\t(Token: %s)\n", Hash(token), token)

}

func main() {
  PrintHash("test@gmail.com")
  PrintHash("+18005551212")
  PrintHash("John")
  PrintHash("Doe")
}

Base64

/*
Provides the hashing algorithm, as well as some valid hashes of sample data for testing.

Sample hashes:

  - Email 'test@gmail.com': h5JGBrQTGorO7q6IaFMfu5cSqqB6XTp1aybOD11spnQ=
  - Phone '+18005551212':   YdkRG+0+bZz8G8O1yzWkAmh8TxVGvuBhor1ET73WTEQ=
  - First name 'John':      ltljLzY1ZMwwMlIUCc8iqFLyAy7sCZ7VlnwNAAzsYHo=
  - Last name 'Doe':        eZ75KhGvkY4/t0HfQpNPO1aO0tk6wd908bjUGieTKm8=
*/
package main

import (
  "crypto/sha256"
  "encoding/base64"
  "fmt"
  "strings"
)

// Hash hashes an email, phone, first name, or last name into the correct format.
func Hash(token string) string {
  formatted := strings.TrimSpace(strings.ToLower(token))
  hashed := sha256.Sum256([]byte(formatted))
  encoded := base64.StdEncoding.EncodeToString(hashed[:])
  return encoded
}

// PrintHash prints the hash for a token.
func PrintHash(token string) {
  fmt.Printf("Hash: \"%s\"\t(Token: %s)\n", Hash(token), token)

}

func main() {
  PrintHash("test@gmail.com")
  PrintHash("+18005551212")
  PrintHash("John")
  PrintHash("Doe")
}

Java

Base16

package updm.hashing;

import static java.nio.charset.StandardCharsets.UTF_8;

import com.google.common.base.Ascii;
import com.google.common.hash.Hashing;

/**
 * Example of the UPDM hashing algorithm using hex-encoded SHA-256.
*
* <p>This uses the Guava Hashing to generate the hash: https://github.com/google/guava
*
* <p>Sample valid hashes:
*
* <ul>
*   <li>Email "test@gmail.com": "87924606b4131a8aceeeae8868531fbb9712aaa07a5d3a756b26ce0f5d6ca674"
*   <li>Phone "+18005551212": "61d9111bed3e6d9cfc1bc3b5cb35a402687c4f1546bee061a2bd444fbdd64c44"
*   <li>First name "John": "96d9632f363564cc3032521409cf22a852f2032eec099ed5967c0d000cec607a"
*   <li>Last name "Doe": "799ef92a11af918e3fb741df42934f3b568ed2d93ac1df74f1b8d41a27932a6f"
* </ul>
*/
public final class HashExample {

  private HashExample() {}

  public static String hash(String token) {
    // Normalizes and hashes the input token.
    String formattedToken = Ascii.toLowerCase(token).strip();
    return Hashing.sha256().hashString(formattedToken, UTF_8).toString();
  }

  public static void printHash(String token) {
    // Calculates and prints the token's hash.
    System.out.printf("Hash: \"%s\"\t(Token: %s)\n", hash(token), token);
  }

  public static void main(String[] args) {
    // Executes hash calculations and prints results for sample tokens.
    printHash("test@gmail.com");
    printHash("+18005551212");
    printHash("John");
    printHash("Doe");
  }
}

Base64

package updm.hashing;

import static java.nio.charset.StandardCharsets.UTF_8;

import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
import java.util.Base64;

/**
* Example of the hashing algorithm.
*
* <p>Sample hashes:
*
* <ul>
*   <li>Email 'test@gmail.com': h5JGBrQTGorO7q6IaFMfu5cSqqB6XTp1aybOD11spnQ=
*   <li>Phone '+18005551212': YdkRG+0+bZz8G8O1yzWkAmh8TxVGvuBhor1ET73WTEQ=
*   <li>First name 'John': ltljLzY1ZMwwMlIUCc8iqFLyAy7sCZ7VlnwNAAzsYHo=
*   <li>Last name 'Doe': eZ75KhGvkY4/t0HfQpNPO1aO0tk6wd908bjUGieTKm8=
* </ul>
*/
public final class HashExample {

private HashExample() {}

public static String hash(String token) {
  // Normalizes and hashes the input token using SHA-256 and Base64 encoding.
  String formattedToken = token.toLowerCase().strip();

  byte[] hash;
  try {
    hash = MessageDigest.getInstance("SHA-256").digest(formattedToken.getBytes(UTF_8));
  } catch (NoSuchAlgorithmException e) {
    throw new IllegalStateException("SHA-256 not supported", e);
  }

  return Base64.getEncoder().encodeToString(hash);
}

public static void printHash(String token) {
  // Calculates and prints the hash for the given token.
  System.out.printf("Hash: \"%s\"\t(Token: %s)\n", hash(token), token);
}

public static void main(String[] args) {
  // Executes hash calculations and prints results for sample tokens.
  printHash("test@gmail.com");
  printHash("+18005551212");
  printHash("John");
  printHash("Doe");
}
}

SQL

Base16

/*
Provides the hashing algorithm, as well as some valid hashes of sample data for testing.

The following code uses Google Standard SQL and can be run on BigQuery to generate match tables from unhashed data.

Sample hashes:

  - Email 'test@gmail.com': 87924606b4131a8aceeeae8868531fbb9712aaa07a5d3a756b26ce0f5d6ca674
  - Phone '+18005551212':   61d9111bed3e6d9cfc1bc3b5cb35a402687c4f1546bee061a2bd444fbdd64c44
  - First name 'John':      96d9632f363564cc3032521409cf22a852f2032eec099ed5967c0d000cec607a
  - Last name 'Doe':        799ef92a11af918e3fb741df42934f3b568ed2d93ac1df74f1b8d41a27932a6f

The unhashed input table schema is assumed to be:

- Column name: UserID, Type: String
- Column name: Email, Type: String
- Column name: Phone, Type: String
- Column name: FirstName, Type: String
- Column name: LastName, Type: String
- Column name: PostalCode, Type: String
- Column name: CountryCode, Type: String
*/

-- Creates a new table with hashed versions of specified columns from the input table.
CREATE TABLE `your_project_name.your_dataset_name.output_hashed_table_name`
AS
SELECT
  UserID,
  TO_HEX(SHA256(LOWER(Email))) AS Email,
  TO_HEX(SHA256(Phone)) AS Phone,
  TO_HEX(SHA256(LOWER(FirstName))) AS FirstName,
  TO_HEX(SHA256(LOWER(LastName))) AS LastName,
  PostalCode,
  CountryCode,
FROM
  `your_project_name.your_dataset_name.input_unhashed_table_name`;

Base64

/*
Provides the hashing algorithm, as well as some valid hashes of sample data for testing.

The following code uses Google Standard SQL and can be run on BigQuery to generate match tables from unhashed data.

Sample hashes:

  - Email 'test@gmail.com': h5JGBrQTGorO7q6IaFMfu5cSqqB6XTp1aybOD11spnQ=
  - Phone '+18005551212':   YdkRG+0+bZz8G8O1yzWkAmh8TxVGvuBhor1ET73WTEQ=
  - First name 'John':      ltljLzY1ZMwwMlIUCc8iqFLyAy7sCZ7VlnwNAAzsYHo=
  - Last name 'Doe':        eZ75KhGvkY4/t0HfQpNPO1aO0tk6wd908bjUGieTKm8=

The unhashed input table schema is assumed to be:

- Column name: UserID, Type: String
- Column name: Email, Type: String
- Column name: Phone, Type: String
- Column name: FirstName, Type: String
- Column name: LastName, Type: String
- Column name: PostalCode, Type: String
- Column name: CountryCode, Type: String
*/

-- Creates a new table with Base64-encoded SHA-256 hashes of specified columns.
CREATE TABLE `your_project_name.your_dataset_name.output_hashed_table_name`
AS
SELECT
  UserID,
  TO_BASE64(SHA256(LOWER(Email))) AS Email,
  TO_BASE64(SHA256(Phone)) AS Phone,
  TO_BASE64(SHA256(LOWER(FirstName))) AS FirstName,
  TO_BASE64(SHA256(LOWER(LastName))) AS LastName,
  PostalCode,
  CountryCode,
FROM
  `your_project_name.your_dataset_name.input_unhashed_table_name`;

Połącz klucze

Niektóre kombinacje danych przekazywanych przez użytkowników są skuteczniejsze niż inne. Poniżej znajduje się lista różnych kombinacji danych przekazywanych przez użytkowników, uporządkowanych według względnej siły. Jeśli używasz adresu, musisz podać imię, nazwisko, kraj i kod pocztowy.

  1. E-mail, telefon, adres (najsilniejsze).
  2. Telefon, adres
  3. E-mail, adres
  4. E-mail, telefon
  5. Adres
  6. Telefon
  7. E-mail (najsłabszy)

Tworzenie tabeli dopasowań

  1. Kliknij Połączenia > Utwórz połączenie > Dopasowywanie danych własnych i przekazywanych przez użytkowników.
  2. Wybierz źródło danych i kliknij Połącz.
  3. Potwierdź swoją tożsamość (jeśli pojawi się taka prośba), a potem kliknij Dalej:

    BigQuery

    Kliknij Zastosuj, aby przyznać dostęp do BigQuery.

    Cloud Storage

    Aby przyznać dostęp do Cloud Storage, kliknij Zastosuj.

    MySQL

    Wpisz lokalizację, port, nazwę użytkownika i hasło do bazy danych MySQL.

    S3

    Wpisz tajny klucz dostępu Amazon S3.

    PostgreSQL

    Wpisz lokalizację, port, nazwę użytkownika, hasło i nazwę bazy danych PostgreSQL.

    Redshift

    Wpisz lokalizację, port, nazwę użytkownika, hasło i nazwę bazy danych Redshift.

    sFTP

    Wpisz lokalizację serwera sFTP, nazwę użytkownika i hasło.

    Płatek śniegu

    Wpisz identyfikator konta Snowflake, nazwę użytkownika i hasło.

  4. Skonfiguruj źródło danych, a potem kliknij Dalej:

    BigQuery

    Wybierz tabelę BigQuery, którą chcesz zaimportować.

    Cloud Storage

    Wpisz ścieżkę gsutil, np. gs://my-bucket/folder/ i wybierz format pliku.

    Jeśli łączysz ten zasób po raz pierwszy, pojawi się alert. Aby przyznać dostęp, kliknij kolejno Zastosuj i Dalej. Uwaga: musisz mieć rolę z uprawnieniami do przekazywania uprawnień storage.buckets.setIamPolicy do odpowiedniego zasobnika.

    MySQL

    Wybierz bazę danych i tabelę MySQL, których chcesz używać.

    S3

    Wpisz identyfikator URI pliku, który chcesz przesłać (względny w stosunku do adresu hosta).

    PostgreSQL

    Wpisz nazwę schematu i tabeli (lub widoku) w PostgreSQL.

    Redshift

    Wpisz nazwę schematu i tabeli (lub widoku) w Redshift. Domyślnie Redshift używa adresów URL lokalizacji bazy danych zgodnych z tym szablonem:cluster-identifier.account-number.aws-region.redshift.amazonaws.com

    sFTP

    Wpisz ścieżkę i nazwę pliku w formacie:/PATH/FILENAME.csv

    Płatek śniegu

    Wpisz nazwę bazy danych, schematu i tabeli (lub widoku) w Snowflake, których chcesz używać.

  5. Wybierz zbiór danych BigQuery, który ma służyć jako pośrednie miejsce docelowe, a potem kliknij Dalej. Dzięki temu będziesz mieć pewność, że dane są prawidłowo sformatowane.
  6. Opcjonalnie: zmień format danych. Transformacje obejmują obliczanie haszy, formatowanie w dużych lub małych literach oraz łączenie i dzielenie pól.
    1. Kliknij Działanie > > Przekształcenie.
    2. W panelu, który się pojawi, kliknij Dodaj przekształcenie lub Dodaj kolejne przekształcenie.
    3. W menu wybierz typ przekształcenia i wpisz wymagania.
    4. Kliknij Zapisz.
  7. Wybierz co najmniej 1 klucz złączenia i zmapuj pola, których chcesz używać. Centrum danych reklam automatycznie zmapuje pola o identycznych nazwach, oznaczone symbolem . Wprowadź ewentualne zmiany, a potem kliknij Dalej.
  8. Ustaw harmonogram:
    1. Nazwij połączenie.
    2. Określ częstotliwość, z jaką dane mają być importowane do zbioru danych wybranego w poprzednim kroku. Każde uruchomienie zastąpi dane w tabeli docelowej.
    3. Określ, jak chcesz obsługiwać kolizje identyfikatorów użytkowników. Możesz wybrać, czy chcesz zachować dotychczasowe dopasowanie, czy zastąpić je nowymi danymi.
  9. Kliknij Zakończ. Tabele odpowiedników są zwykle gotowe do użycia po 12 godzinach od ich utworzenia.

Wyświetlanie szczegółów połączenia

Na stronie z informacjami o połączeniu znajdziesz informacje o ostatnich uruchomieniach i błędach danego połączenia. Aby wyświetlić szczegóły konkretnego połączenia:

  1. Kliknij Połączenia.
  2. Kliknij nazwę połączenia, aby wyświetlić jego szczegóły.
  3. Możesz teraz zobaczyć szczegóły połączenia i jego ostatnie uruchomienia. Każdy z nich pokazuje 2 możliwe typy błędów: na poziomie połączenia (połączenie nie zostało wykonane) i na poziomie wiersza (wiersz nie został zaimportowany).
    1. Stan Niepowodzenie oznacza, że nie udało się uruchomić całego połączenia (np. z powodu problemu z uprawnieniami konta usługi). Kliknij stan błędu, aby zobaczyć, które błędy wpłynęły na połączenie.
    2. Stan Ukończone oznacza, że połączenie zostało ustanowione. Nadal jednak mogą występować błędy na poziomie wiersza, co jest sygnalizowane przez wartość inną niż 0 w kolumnie „Wiersze z błędami”. Kliknij wartość, aby dowiedzieć się, które rekordy się nie udało zaktualizować.

Edytowanie połączenia

Możesz edytować te informacje:

  • Nazwa połączenia
  • Zaplanuj
  • Tabela docelowa
  • Mapowanie pól

Edytowanie źródła danych nie jest obsługiwane. Aby zmienić źródło danych, utwórz nowe połączenie i usuń stare.

Aby edytować szczegóły połączenia:

  1. Kliknij Połączenia.
  2. Kliknij nazwę połączenia, które chcesz edytować.
  3. Edytuj szczegóły, które chcesz zmienić:
    • Nazwa połączenia: kliknij Edytuj, wpisz nową nazwę i naciśnij Enter.
    • Harmonogram: kliknij Edytuj, ustaw nowy harmonogram, a następnie kliknij Zapisz.
    • Tabela miejsc docelowych: kliknij Edytuj, wpisz nową nazwę miejsca docelowego i kliknij Zapisz.
    • Mapowanie pól: kliknij , wprowadź zmiany w polach, a następnie kliknij Zapisz.
  4. Kliknij .

Wykonywanie zapytań dotyczących dopasowanych danych

Wykonywanie zapytań dotyczących tabel odpowiedników

Gdy tabele odpowiedników zawierają wystarczającą ilość danych, aby spełnić wymagania mechanizmów kontroli prywatności, możesz wykonywać zapytania dotyczące tych tabel.

Pierwotna tabela danych własnych (1PD) jest reprezentowana przez my_data. Obejmuje to zarówno informacje umożliwiające identyfikację osoby, jak i dane niebędące informacjami umożliwiającymi identyfikację. Korzystanie z pierwotnej tabeli może wzbogacić Twoje raporty o dodatkowe statystyki, ponieważ zawiera ona wszystkie dane 1PD w zakresie, w którym są one dostępne w tabeli odpowiedników.

Każdej tabeli w schemacie Centrum danych reklam, która zawiera pole user_id, towarzyszy tabela odpowiedników. Na przykład w przypadku tabeli adh.google_ads_impressions Centrum danych reklam generuje też tabelę odpowiedników o nazwie adh.google_ads_impressions_updm, która zawiera Twoje identyfikatory użytkowników. W przypadku tabel odseparowanych zgodnie z zasadami tworzone są osobne tabele odpowiedników. Na przykład w przypadku tabeli adh.google_ads_impressions_policy_isolated_youtube Centrum danych reklam generuje też tabelę odpowiedników o nazwie adh.google_ads_impressions_policy_isolated_youtube_updm, która zawiera Twoje identyfikatory użytkowników.

Te tabele obejmują podzbiór użytkowników dostępnych w pierwotnych tabelach dopasowanych do identyfikatorów user_id. Jeśli na przykład pierwotna tabela zawiera dane dotyczące użytkowników A i B, ale dopasowane zostanie tylko konto użytkownika A, użytkownik B nie znajdzie się w tabeli odpowiedników.

Tabele odpowiedników zawierają dodatkową kolumnę o nazwie customer_data_user_id, która przechowuje identyfikator użytkownika w postaci bajtów.

Podczas tworzenia zapytań należy zwracać uwagę na typ pola. Operatory porównania SQL wymagają, aby porównywane literały były tego samego typu. Ostrzeżenie: w zależności od sposobu, w jaki w tabeli danych własnych przechowywane są dane (user_id), przed przystąpieniem do dopasowywania danych może być konieczne zakodowanie wartości w tabeli. Aby zapewnić prawidłowe dopasowanie, musisz przeformatować klucz łączenia na bajty:

JOIN ON
  adh.google_ads_impressions_updm.customer_data_user_id = CAST(my_data.user_id AS BYTES)

Poza tym porównania ciągów znaków w języku SQL uwzględniają wielkość liter, więc dokładne porównywanie ciągów znaków może wymagać ich zakodowania po obu stronach porównania.

Przykładowe zapytania

Liczba dopasowanych użytkowników

To zapytanie zlicza liczbę dopasowanych użytkowników w tabeli wyświetleń Google Ads.

/* Count matched users in Google Ads impressions table */

SELECT COUNT(DISTINCT user_id)
FROM adh.google_ads_impressions_updm

Obliczanie współczynnika dopasowania

Nie wszyscy użytkownicy kwalifikują się do dopasowania. Na przykład niezalogowani użytkownicy, dzieci i użytkownicy, którzy nie wyrazili zgody, nie są dopasowywani za pomocą UPDM. Za pomocą pola is_updm_eligible możesz obliczyć dokładniejsze współczynniki dopasowania UPDM. Pamiętaj, że pole is_updm_eligible było dostępne od 1 października 2024 r. Przed tą datą nie możesz używać tego pola do obliczania współczynników dopasowania.

/* Calculate the UPDM match rate */

CREATE TEMP TABLE total_events OPTIONS(privacy_checked_export=TRUE) AS
SELECT
  customer_id,
  COUNT(*) AS n
FROM adh.google_ads_impressions
WHERE is_updm_eligible
GROUP BY 1;

CREATE TEMP TABLE matched_events OPTIONS(privacy_checked_export=TRUE) AS
SELECT
  customer_id,
  COUNT(*) AS n
FROM adh.google_ads_impressions_updm
GROUP BY 1;

SELECT
  customer_id,
  SAFE_DIVIDE(matched_events.n, total_events.n) AS match_rate
FROM total_events
LEFT JOIN matched_events
  USING (customer_id)

Złączanie danych własnych i Google Ads

To zapytanie pokazuje, jak złączyć dane własne z danymi Google Ads:

/* Join first-party data with Google Ads data. The customer_data_user_id field
contains your ID as BYTES. You need to cast your join key into BYTES for
successful matches. */

SELECT
  inventory_type,
  COUNT(*) AS impressions
FROM
  adh.yt_reserve_impressions_updm AS google_data_imp
LEFT JOIN
  `my_data`
ON
  google_data_imp.customer_data_user_id = CAST(my_data.user_id AS BYTES)
GROUP BY
  inventory_type

Najczęstsze pytania dotyczące UPDM

Listę najczęstszych pytań dotyczących UPDM znajdziesz w artykule Odpowiedzi na najczęstsze pytania dotyczące UPDM.