CrUX sur BigQuery

Découvrez comment les données CrUX sont structurées dans BigQuery.

Introduction

Les données brutes sur lesquelles repose le rapport d'expérience utilisateur Chrome (CrUX) sont disponibles sur BigQuery, une base de données hébergée sur Google Cloud Platform (GCP).

CrUX sur BigQuery permet aux utilisateurs d'interroger directement l'ensemble de données complet remontant à 2017, par exemple pour analyser les tendances, comparer les technologies Web et comparer les domaines.

Les données sont structurées par publication mensuelle, ainsi que par un certain nombre de tableaux récapitulatifs pour faciliter l'accès aux données et les interroger. Vous les trouverez plus loin dans cette documentation.

Les données BigQuery constituent la base du tableau de bord CrUX, qui vous permet de les visualiser sans avoir à écrire de requêtes SQL.

Accéder à l'ensemble de données dans GCP

L'utilisation de BigQuery nécessite un projet GCP et des connaissances de base du langage SQL. L'accès à l'ensemble de données CrUX sur BigQuery est sans frais et permet de l'explorer dans les limites du niveau sans frais, qui est renouvelé tous les mois et fourni par BigQuery. En outre, les nouveaux utilisateurs de GCP peuvent bénéficier d'un crédit d'inscription pour couvrir les dépenses au-delà du quota sans frais. Notez qu'une carte de crédit doit être fournie pour le projet GCP. Consultez la section Pourquoi dois-je fournir une carte de crédit ?.

Si vous utilisez BigQuery pour la première fois, suivez les étapes ci-dessous pour configurer un projet:

  1. Accédez à Google Cloud Platform.
  2. Cliquez sur Créer un projet.
  3. Donnez un nom à votre nouveau projet, par exemple "Mon rapport d'expérience utilisateur Chrome", puis cliquez sur "Créer".
  4. Indiquez vos informations de facturation si vous y êtes invité.
  5. Accédez à l'ensemble de données CrUX sur BigQuery.

Vous êtes maintenant prêt à commencer à interroger le jeu de données.

Organisation du projet

Les données CrUX sur BigQuery sont publiées le deuxième mardi du mois suivant. Chaque mois est publié sous la forme d'une nouvelle table sous chrome-ux-report.all. Il existe également un certain nombre de tables matérialisées qui fournissent des statistiques récapitulatives pour chaque mois.

Schéma détaillé du tableau

Tableaux bruts

Les tables brutes pour chaque pays et l'ensemble de données all présentent le schéma suivant:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • first_input
    • delay
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

Schéma de la table matérialisée

Les tableaux matérialisées sont fournies pour faciliter l'accès aux données récapitulatives en fonction d'un certain nombre de dimensions clés. Aucun histogramme n'est fourni, mais les données de performances sont agrégées en fractions en fonction de l'évaluation des performances et de la valeur du 75e centile. Voici un ensemble d'exemples de lignes de la table metrics_summary:

aaaamm origine fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0,9056 0,0635 0,0301 1600
202203 https://example.com 0,9209 0,052 0,0274 1 400
202202 https://example.com 0,9169 0,0545 0,0284 1 500
202201 https://example.com 0,9072 0,0626 0,0298 1 500

Cela montre que dans l'ensemble de données de 202204, 90, 56% des expériences utilisateur réelles sur https://example.com répondaient aux critères d'un bon LCP,et que la valeur approximative du LCP au 75e centile était de 1 600 ms. C'est un peu plus lent que les mois précédents.

Quatre tables matérialisées sont fournies:

metrics_summary
métriques clés par mois et origine
device_summary
métriques clés par mois, origine et type d'appareil
country_summary
métriques clés par mois, origine, type d'appareil et pays
origin_summary
Liste de toutes les origines incluses dans l'ensemble de données

metrics_summary

La table metrics_summary contient des statistiques récapitulatives pour chaque origine et chaque ensemble de données mensuel:

yyyymm
Mois de la collecte des données
origin
URL de l'origine du site
rank
Classement général de popularité (mars 2021)
[small|medium|large]_cls
fraction du trafic par seuil CLS
[fast|avg|slow]_<metric>
fraction du trafic par seuils de performances
p75_<metric>
Valeur du 75e centile des métriques de performances (millisecondes)
notification_permission_[accept|deny|ignore|dismiss]
fraction des comportements liés aux autorisations de notifications
[desktop|phone|tablet]Density
fraction du trafic par facteur de forme
[_4G|_3G|_2G|slow2G|offline]Density
Fraction du trafic par type de connexion effectif

device_summary

Le tableau device_summary contient des statistiques agrégées par mois, origine, pays et appareil. Outre les colonnes metrics_summary, on trouve les éléments suivants:

device
Facteur de forme de l'appareil

country_summary

Le tableau country_summary contient des statistiques agrégées par mois, origine, pays et appareil. Outre les colonnes metrics_summary, on trouve les éléments suivants:

country_code
Code pays à deux lettres
device
Facteur de forme de l'appareil

origin_summary

La table origin_summary contient la liste de toutes les origines de l'ensemble de données CrUX. Elle est mise à jour tous les mois avec la dernière liste des origines de l'ensemble de données et comporte une seule colonne: origin.

Ensemble de données expérimental

Les tables de l'ensemble de données expérimental sont des copies exactes des tables YYYYMM par défaut, mais elles utilisent des fonctionnalités BigQuery plus récentes et plus avancées, telles que le partitionnement et le clustering, qui vous permettent d'écrire des requêtes plus rapides, plus simples et moins coûteuses.

country

L'ensemble de données experimental.country contient des données globales issues des ensembles de données country_CC, ainsi qu'une colonne yyyymm supplémentaire pour la date de l'ensemble de données. Le schéma est identique à celui des tables brutes, avec l'ajout des colonnes de date et country_code, ce qui permet d'exécuter des requêtes de comparaison temporelle au niveau du pays sans joindre les tables mensuelles.

global

L'ensemble de données experimental.global contient des données globales de l'ensemble de données all, ainsi qu'une colonne yyyymm supplémentaire pour la date de l'ensemble de données. Le schéma est identique aux tables brutes, avec l'ajout d'une date, ce qui permet d'exécuter des requêtes de comparaison au fil du temps sans joindre les tables mensuelles.