Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Présentation des robots d'exploration Google (user-agents)

Le terme générique "robot d'exploration", ou plus simplement "robot", désigne tout programme qui permet de découvrir et d'analyser automatiquement des sites Web en suivant des liens d'une page Web à une autre. Notre robot d'exploration principal s'appelle Googlebot. Le tableau ci-après présente les caractéristiques des robots d'exploration Google classiques qui peuvent figurer dans les fichiers journaux de votre URL de provenance, ainsi que la manière dont ils doivent être indiqués dans le fichier robots.txt, dans les balises meta robots et dans les règles HTTP X-Robots-Tag.

Le tableau suivant présente les robots utilisés par divers produits et services Google :

  • Le jeton user-agent est utilisé dans la ligne User-agent: du fichier robots.txt pour indiquer le type de robot d'exploration lors de l'écriture des règles d'exploration pour votre site. Comme indiqué dans le tableau, certains robots utilisent plusieurs jetons. Un seul jeton de robot doit correspondre pour qu'une règle s'applique. Cette liste n'est pas exhaustive, mais couvre la plupart des robots que vous pouvez voir sur votre site Web.
  • La chaîne user-agent complète est une description complète du robot d'exploration. Elle apparaît dans la requête HTPP ainsi que dans vos journaux Web.

Robots d'exploration

APIs-Google

Jeton user-agent APIs-Google
Chaîne user-agent complète APIs-Google (+https://developers.google.com/webmasters/APIs-Google.html)

AdsBot Mobile Web Android

Vérifie la qualité des annonces sur les pages Web pour Android.

Jeton user-agent AdsBot-Google-Mobile
Chaîne user-agent complète Mozilla/5.0 (Linux; Android 5.0; SM-G920A) AppleWebKit (KHTML, like Gecko) Chrome Mobile Safari (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html)

AdsBot Mobile Web

Vérifie la qualité des annonces sur les pages Web pour iPhone.

Jeton user-agent AdsBot-Google-Mobile
Chaîne user-agent complète Mozilla/5.0 (iPhone; CPU iPhone OS 14_7_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1.2 Mobile/15E148 Safari/604.1 (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html)

AdsBot

Vérifie la qualité des annonces sur les pages Web pour ordinateur.

Jeton user-agent AdsBot-Google
Chaîne user-agent complète AdsBot-Google (+http://www.google.com/adsbot.html)

AdSense

Jeton user-agent Mediapartners-Google
Chaîne user-agent complète Mediapartners-Google

Googlebot Image

Jetons user-agent
  • Googlebot-Image
  • Googlebot
Chaîne user-agent complète Googlebot-Image/1.0

Googlebot-News

Jetons user-agent
  • Googlebot-News
  • Googlebot
Chaîne user-agent complète Le user-agent Googlebot-News utilise les différentes chaînes de user-agents Googlebot.

Centre pour les éditeurs de Google

Récupère et traite les flux que les éditeurs ont explicitement fournis via le Centre pour les éditeurs de Google à utiliser sur les pages de destination de Google Actualités.

Jeton user-agent GoogleProducer
Chaîne user-agent complète GoogleProducer; (+http://goo.gl/7y4SX)

Googlebot Video

Jetons user-agent
  • Googlebot-Video
  • Googlebot
Chaîne user-agent complète Googlebot-Video/1.0

Googlebot pour ordinateur

Jeton user-agent Googlebot
Chaînes user-agent complètes
  • Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
  • Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Googlebot/2.1; +http://www.google.com/bot.html) Chrome/W.X.Y.Z Safari/537.36
  • Googlebot/2.1 (+http://www.google.com/bot.html)

Googlebot pour smartphone

Jeton user-agent Googlebot
Chaîne user-agent complète Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

Mobile AdSense

Jeton user-agent Mediapartners-Google
Chaîne user-agent complète (Various mobile device types) (compatible; Mediapartners-Google/2.1; +http://www.google.com/bot.html)

Mobile Apps Android

Vérifie la qualité des annonces sur les pages d'applications Android. Respecte les règles des robots AdsBot-Google.

Jeton user-agent AdsBot-Google-Mobile-Apps
Chaîne user-agent complète AdsBot-Google-Mobile-Apps

Feedfetcher

Jeton user-agent FeedFetcher-Google
Chaîne user-agent complète FeedFetcher-Google; (+http://www.google.com/feedfetcher.html)

Google Read Aloud

Jeton user-agent Google-Read-Aloud
Chaînes user-agent complètes

Agents actuels :

  • Agent pour ordinateur :
    Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.118 Safari/537.36 (compatible; Google-Read-Aloud; +https://developers.google.com/search/docs/crawling-indexing/overview-google-crawlers)
  • Agent mobile :
    Mozilla/5.0 (Linux; Android 7.0; SM-G930V Build/NRD90M) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.125 Mobile Safari/537.36 (compatible; Google-Read-Aloud; +https://developers.google.com/search/docs/crawling-indexing/overview-google-crawlers)

Ancien agent (obsolète) :

google-speakr

Google Favicon

Jeton user-agent
  • Googlebot-Image
  • Googlebot
Chaîne user-agent complète Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.75 Safari/537.36 Google Favicon

Google StoreBot

Jeton user-agent Storebot-Google
Chaînes user-agent complètes
  • Agent pour ordinateur :

    Mozilla/5.0 (X11; Linux x86_64; Storebot-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36

  • Agent mobile :

    Mozilla/5.0 (Linux; Android 8.0; Pixel 2 Build/OPD3.170816.012; Storebot-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Mobile Safari/537.36

Google Site Verifier

Jeton user-agent Google-Site-Verification
Chaîne user-agent complète Mozilla/5.0 (compatible; Google-Site-Verification/1.0)

Remarque concernant Chrome/W.X.Y.Z dans les user-agents :

Chaque fois que vous voyez Chrome/W.X.Y.Z dans les chaînes du user-agent dans ce tableau, sachez que W.X.Y.Z est un espace réservé qui correspond à la version du navigateur Chrome utilisée par ce user-agent (par exemple, 41.0.2272.96). Ce numéro de version augmente au fil du temps afin de représenter la dernière version de Chromium utilisée par Googlebot.

Si vous effectuez une recherche dans vos journaux ou si vous filtrez votre serveur afin d'identifier un user-agent avec ce format, utilisez des caractères génériques pour le numéro de version au lieu de spécifier un numéro de version précis.

User-agents dans le fichier robots.txt

Lorsque plusieurs user-agents sont reconnus dans le fichier robots.txt, Google suit le plus spécifique d'entre eux. Si vous souhaitez que tous nos robots d'exploration puissent explorer vos pages, vous n'avez pas besoin de fichier robots.txt. En revanche, si vous voulez bloquer ou autoriser l'accès de nos robots d'exploration à certains de vos contenus, vous pouvez indiquer Googlebot comme user-agent. Par exemple, si vous souhaitez que toutes vos pages s'affichent dans la recherche Google et que des annonces AdSense soient diffusées sur celles-ci, vous n'avez pas besoin de fichier robots.txt. De même, si vous souhaitez nous empêcher d'accéder à certaines pages, vous pouvez bloquer le user-agent Googlebot. Tous nos autres user-agents seront alors bloqués eux aussi.

Toutefois, vous pouvez contrôler l'exploration de vos pages de manière plus précise. Par exemple, vous souhaiterez peut-être que toutes vos pages s'affichent dans la recherche Google, mais que les images de votre répertoire personnel ne soient pas explorées. Dans ce cas, utilisez le fichier robots.txt pour interdire au user-agent Googlebot-Image d'explorer les fichiers de votre répertoire personnel (tout en autorisant Googlebot à explorer tous vos fichiers) :

User-agent: Googlebot
Disallow:

User-agent: Googlebot-Image
Disallow: /personal

Prenons un autre exemple. Supposons que vous souhaitiez voir s'afficher des annonces sur l'ensemble de vos pages. Toutefois, vous ne voulez pas que ces pages s'affichent dans la recherche Google. En utilisant ces lignes de code, vous bloquez Googlebot, mais autorisez le user-agent Mediapartners-Google :

User-agent: Googlebot
Disallow: /

User-agent: Mediapartners-Google
Disallow:

User-agents dans des balises meta robots

Certaines pages utilisent plusieurs balises meta robots afin de spécifier des règles pour différents robots d'exploration, comme ceci :

<meta name="robots" content="nofollow">
<meta name="googlebot" content="noindex">

Dans cet exemple, nous utiliserons la somme des règles d'exclusion et Googlebot suivra à la fois la règle noindex et la règle nofollow. En savoir plus sur la manière de contrôler l'exploration et l'indexation de votre site par nos services

Contrôler la vitesse d'exploration

Chaque robot d'exploration Google accède aux sites à des fins spécifiques et à une fréquence qui varie. Google utilise des algorithmes pour déterminer la vitesse d'exploration optimale pour chaque site. Si un robot d'exploration Google explore votre site trop souvent, vous pouvez réduire sa vitesse d'exploration.

Robots d'exploration Google supprimés

Les robots d'exploration Google suivants ne sont plus utilisés et ne sont notés ici qu'à titre indicatif.

Robots d'exploration Google supprimés

Duplex sur le Web

Compatible avec le service Duplex sur le Web

Jeton user-agent DuplexWeb-Google
Chaîne user-agent complète Mozilla/5.0 (Linux; Android 11; Pixel 2; DuplexWeb-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.193 Mobile Safari/537.36

Web Light

Vérifiait de la présence de l'en-tête no-transform chaque fois qu'un utilisateur cliquait sur votre page dans la recherche, dans les conditions appropriées Le user-agent Web Light n'était utilisé que pour les requêtes de navigation explicites d'un visiteur humain. Il pouvait donc ignorer les règles du fichier robots.txt, qui bloquent les requêtes d'exploration automatisée.

Jeton user-agent googleweblight
Chaîne user-agent complète Mozilla/5.0 (Linux; Android 4.2.1; en-us; Nexus 5 Build/JOP40D) AppleWebKit/535.19 (KHTML, like Gecko; googleweblight) Chrome/38.0.1025.166 Mobile Safari/535.19