Présentation détaillée du filtrage et des limites des données sur les performances dans la Search Console

Mercredi 19 octobre 2022

Les données sur les performances de la recherche Google sont les plus utilisées dans la Search Console, à la fois via le rapport sur les performances et l'API Search Analytics. Cet article explique en détail la nature des données disponibles et la manière dont Google les traite, y compris pour appliquer des filtres de confidentialité et d'autres limites liées à la latence de diffusion, au stockage et au traitement des ressources. Vous vous demandez peut-être comment fonctionnent ces systèmes. Examinons-les en détail.

Si c'est la première fois que vous accédez à Search Console, consultez Présentation des rapports sur les performances.

Principes de base des performances de la recherche

Le rapport sur les performances comprend quatre métriques qui indiquent l'évolution de votre trafic en provenance des moteurs de recherche au fil du temps. Pour en savoir plus, consultez l'article sur le mode de calcul de chaque métrique, dont voici un résumé :

  • Clics : nombre de clics vers votre propriété effectués par les utilisateurs à partir des résultats de recherche Google.
  • Impressions : nombre de fois où les utilisateurs ont vu votre propriété dans les résultats de recherche Google.
  • CTR (taux de clics) : nombre de clics divisé par le nombre d'impressions.
  • Position : position moyenne dans les résultats de recherche pour une URL, une requête ou un site Web en général.

Chacune de ces métriques peut être analysée en fonction de différentes dimensions. Vous pouvez examiner les performances de chacune des requêtes, pages, pays, appareils ou apparences dans les résultats de recherche qui génèrent du trafic vers votre site Web.

Il existe de nombreuses façons d'accéder aux données sur les performances de la recherche, dont l'interface produit, l'API Search Analytics et le connecteur Looker Studio et les feuilles de calcul (nécessite un téléchargement manuel depuis l'interface).

Si vous utilisez l'interface produit, les dimensions sont disponibles via les filtres ou les tableaux des dimensions situés après le graphique, comme illustré ci-dessous.

Rapport sur les performances dans la Search Console

Ces données peuvent servir à trouver des moyens d'améliorer la visibilité de votre site Web et de générer plus de trafic depuis Google. Pour voir un exemple des analyses que vous pouvez effectuer, consultez cet exemple de tableau d'optimisation.

Filtrage et limites des données

Les données de l'interface du rapport et les données exportées sont agrégées et filtrées de différentes manières. Vous trouverez ci-dessous les deux principaux types de limitation des données : le filtrage pour raisons de confidentialité et la limite quotidienne du nombre de lignes de données.

Filtrage pour raisons de confidentialité

Certaines requêtes (appelées "requêtes anonymisées") ne figurent pas dans les données de la Search Console afin de protéger la confidentialité de l'utilisateur qui effectue la requête.

Les requêtes effectuées par seulement quelques dizaines d'utilisateurs sur une période de deux à trois mois sont anonymisées. Pour des raisons de confidentialité, les requêtes réelles ne s'affichent pas dans les données sur les performances de la recherche Google. C'est pourquoi nous les appelons "requêtes anonymisées". Bien que ces requêtes soient toujours exclues des tables, elles figurent dans les totaux des graphiques, sauf si vous les filtrez par requête.

Examinons un cas pour mieux comprendre. Notez qu'il n'est présenté qu'à titre d'exemple et qu'il n'illustre que le filtrage pour raisons de confidentialité, mais les limites quotidiennes du nombre de lignes de données, décrites dans la section suivante, peuvent aussi avoir un impact. Supposons que le tableau ci-dessous présente l'ensemble du trafic lié aux requêtes vers votre site Web, avec le détail du trafic provenant de requêtes non anonymisées. Nous n'en présentons que quatre pour les besoins de cet exemple, car bien entendu, un site Web est généralement associé à davantage de requêtes non anonymisées.

Requêtes Clics
littérature classique 150
poésie 125
science-fiction 100
essai 75
Sous-total des requêtes détaillées 450
Total 550

Si vous additionnez toutes les requêtes détaillées, comme le montre le tableau, il y a eu 450 clics. Le total des clics vers le site s'élève à 550. Ce nombre est plus élevé, car il inclut tous les clics détaillés et les clics provenant de requêtes anonymes (qui ne sont donc pas listées).

En pratique, lorsque vous utilisez les rapports de la Search Console, vous pouvez rencontrer ce type d'écart de deux façons.

  1. Le tableau du rapport ou de l'API (ajoutée ici à titre d'exemple) ne contient pas de ligne pour les requêtes anonymisées. Par conséquent, lorsque vous additionnez le nombre de clics de toutes les lignes, la somme diffère du total indiqué dans le graphique. Dans ce cas, la somme des lignes indique 450, tandis que le total du graphique indique 550.
  2. Les requêtes anonymisées sont exclues dès lors qu'un filtre est appliqué. Vous observerez donc un écart lorsque vous comparez la somme des clics dans le total du graphique à la somme des clics contenant some_string et excluant some_string. Dans ce cas, si vous utilisez des filtres pour n'inclure que les requêtes contenant le mot "fiction", vous verrez 175 clics et si vous excluez les requêtes le contenant, vous verrez 275 clics, ce qui nous amène à un total de 450 clics, contre 550 dans le total du graphique.

Limite quotidienne du nombre de lignes de données

En raison de limitations liées à la latence de diffusion, au stockage, au traitement des ressources, et à d'autres raisons, la Search Console restreint le volume de données pouvant être affichées ou exportées. La plupart des propriétés dans la Search Console ne sont pas concernées par ces limites. Quelques sites Web très volumineux peuvent être affectés. Dans ces cas, nous estimons que les données restantes sont assez volumineuses pour permettre de générer un échantillon représentatif.

Vous ne pouvez pas exporter plus de 1 000 lignes de données via l'interface utilisateur de la Search Console. Actuellement, la limite supérieure de données pouvant être exportées via l'API Search Analytics (et via le connecteur Looker Studio) est de 50 000 lignes par jour, par site et par type de recherche. Cette limite peut ne pas être atteinte dans tous les cas. Par défaut, l'API renvoie 1 000 lignes, mais vous pouvez utiliser rowLimit pour en afficher 25 000 et startRow pour extraire les lignes 25 001 à 50 000 à l'aide de la pagination. Consultez notre guide pour découvrir comment obtenir les données disponibles.

Pour les demandes qui ne contiennent aucune dimension de requête ou d'URL, mais concernent les pays, les appareils et l'apparence dans les résultats de recherche, la Search Console affiche et exporte l'ensemble des données.

Ressources et commentaires

Pour en savoir plus, consultez la documentation sur les performances. Outre des explications détaillées sur les données disponibles et les écarts que vous pouvez rencontrer dans les graphiques, vous y découvrirez comment utiliser le rapport sur les performances.

Si vous avez des questions ou des doutes, n'hésitez pas à nous contacter via la communauté Google Search Central ou sur Twitter.