Créer et envoyer un sitemap

Cette page explique comment créer un sitemap et l'envoyer à Google. En savoir plus sur les sitemaps

  1. Déterminez quelles pages de votre site Google doit explorer, ainsi que la version canonique de chaque page.
  2. Choisissez le format de sitemap que vous souhaitez utiliser. Vous pouvez créer votre sitemap manuellement. Un certain nombre d'outils tiers permettent également de générer un sitemap à votre place.
  3. Mettez votre sitemap à la disposition de Google en l'ajoutant à votre fichier robots.txt ou en l'envoyant directement sur la Search Console.

Formats de sitemaps

Nous acceptons plusieurs formats de sitemaps, décrits ci-après. Tous les formats du protocole sitemap standard sont acceptés. Pour le moment, Google ne tient pas compte de l'attribut <priority> dans les sitemaps.

Tous les formats imposent la même limite aux sitemaps : 10 Mo (sitemaps non compressés) et 50 000 URL. Si vous avez un fichier plus volumineux ou un nombre d'URL plus élevé, vous devez scinder votre liste en plusieurs sitemaps. Vous pouvez éventuellement créer un fichier d'index de sitemaps, c'est-à-dire un fichier qui redirige vers une liste de sitemaps, et nous envoyer ce fichier d'index unique. Vous pouvez nous envoyer plusieurs sitemaps et/ou fichiers d'index de sitemaps.

XML

Voici un exemple très simple de sitemap XML indiquant l'emplacement d'une URL :

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/foo.html</loc>
<lastmod>2018-06-04</lastmod>
</url>
</urlset>

Des exemples plus complexes et une documentation complète sont disponibles sur sitemaps.org.

Vous y trouverez des exemples de sitemaps spécifiant des pages alternatives et de sitemaps pour les actualités, les images ou les vidéos.

RSS, mRSS et Atom 1.0

Si vous possédez un blog doté d'un flux RSS ou Atom, vous pouvez envoyer l'URL du flux en tant que sitemap. La plupart des logiciels de développement de blogs peuvent créer des flux à votre place, mais ces flux ne fournissent des informations que sur les URL récentes.

  • Nous acceptons les flux RSS 2.0 et Atom 1.0.
  • Vous pouvez utiliser un flux mRSS (Media RSS) pour nous indiquer les détails du contenu vidéo de votre site.

Texte

Si votre sitemap contient exclusivement des URL de pages Web, vous pouvez nous transmettre un simple fichier texte avec une URL par ligne. Exemple :

http://www.example.com/file1.html
http://www.example.com/file2.html
        

Consignes pour les sitemaps sous forme de fichiers texte :

  • Encodez votre fichier en UTF-8.
  • N'insérez aucun élément autre que des URL dans le fichier de sitemap.
  • Vous pouvez donner au fichier texte le nom de votre choix, tant qu'il se termine par l'extension .txt (sitemap.txt, par exemple).

Extensions de sitemaps pour d'autres types de contenus

Nous acceptons les extensions de syntaxe de sitemaps pour les types de supports suivants. Utilisez ces extensions pour décrire des fichiers vidéo, des images et d'autres contenus de votre site difficilement analysables, et ainsi améliorer leur indexation.

Consignes générales relatives aux sitemaps

  • Utilisez des URL cohérentes et absolues. Nous explorons les URL indiquées à la lettre près. Par exemple, si votre site se trouve sur https://www.example.com/, n'indiquez pas l'URL https://example.com/ (www manquant) ou ./mypage.html (URL relative).
  • Un sitemap peut être publié n'importe où sur votre site, mais ne concerne que les descendants du répertoire parent. Par conséquent, un sitemap publié à la racine du site peut affecter tous les fichiers du site. Cet emplacement est recommandé.
  • N'incluez pas d'identifiant de session dans les URL de votre sitemap pour limiter la double exploration de ces URL.
  • Signalez à Google les versions d'une URL dans une autre langue à l'aide des annotations hreflang.
  • Les fichiers sitemaps doivent être encodés en UTF-8 et les URL doivent utiliser les caractères d'échappement appropriés.
  • Scindez les sitemaps volumineux en plusieurs petits sitemaps : un sitemap peut contenir jusqu'à 50 000 URL et ne doit pas dépasser 50 Mo une fois décompressé. Utilisez un fichier d'index de sitemaps pour répertorier tous les sitemaps individuels, et envoyez-nous cet unique fichier au lieu de nous faire parvenir chaque sitemap séparément.
  • Ne répertoriez que les URL canoniques dans vos sitemaps. Si vous proposez deux versions d'une page, ne répertoriez dans le sitemap que la version que vous souhaitez voir apparaître dans les résultats de recherche. Si vous proposez deux versions d'un même site, par exemple avec et sans www, choisissez votre version préférée, ajoutez-y le sitemap et ajoutez rel=canonical ou des redirections sur l'autre site.
  • Si vous avez des URL différentes pour la version classique et la version mobile d'une page, nous vous recommandons de renvoyer vers une seule version. Toutefois, si vous avez besoin de renvoyer vers les deux URL, annotez-les pour indiquer la version classique et la version mobile.
  • Utilisez les extensions de sitemaps pour renvoyer vers d'autres types de supports, tels que des vidéos, des images et des actualités.
  • Si vous avez d'autres pages pour différentes langues ou régions, vous pouvez utiliser un attribut hreflang dans un sitemap ou les balises html pour indiquer ces URL.
  • Caractères non alphanumériques et non latins. Nous vous demandons d'utiliser impérativement un encodage UTF-8 pour votre fichier sitemap. En règle générale, vous pouvez définir ce paramètre au moment d'enregistrer le fichier. Comme pour tous les fichiers XML, les valeurs de données (URL comprises) doivent utiliser des codes d'échappement pour les caractères répertoriés dans le tableau ci-après. Un sitemap ne peut comporter que des caractères ASCII. Il ne peut pas contenir de caractères ASCII en majuscules ni certains codes de contrôle ou caractères spéciaux tels que * et {}. Si l'URL de votre sitemap contient ces caractères, vous obtiendrez une erreur lorsque vous demanderez son indexation.
    Caractère Code d'échappement
    Esperluette & &amp;
    Apostrophe ' &apos;
    Guillemets droits " &quot;
    Supérieur(e) à > &gt;
    Inférieur(e) à < &lt;
    En outre, toutes les URL (y compris celle de votre sitemap) doivent être encodées de façon à pouvoir être lues par le serveur Web sur lequel elles se trouvent et doivent utiliser les caractères d'échappement nécessaires. Cependant, si vous utilisez un quelconque script, outil ou fichier journal pour générer vos URL (plutôt que de les saisir manuellement), cette mise en forme est généralement automatique. Si vous envoyez votre sitemap et que vous recevez un message d'erreur indiquant que nous ne pouvons pas trouver certaines de vos URL, vérifiez que vos URL respectent bien la norme RFC-3986 pour les URI, la norme RFC-3987 pour les IRI et la norme XML.

    Voici un exemple d'URL utilisant un caractère non ASCII (ü), ainsi qu'un caractère nécessitant un échappement d'entité (&) :
    http://www.example.com/ümlat.html&q=name
    Voici cette même URL, encodée en ISO-8859-1 (pour un hébergement sur un serveur utilisant cet encodage), avec échappement d'URL :
    http://www.example.com/%FCmlat.html&q=name
    Voici cette même URL, encodée en UTF-8 (pour un hébergement sur un serveur utilisant cet encodage), avec échappement d'URL :
    http://www.example.com/%C3%BCmlat.html&q=name
    Voici la même URL avec échappement d'entité :
    http://www.example.com/%C3%BCmlat.html&amp;q=name
  • N'oubliez pas que les sitemaps vous permettent de recommander à Google les pages que vous jugez essentielles. Google ne s'engage pas à explorer toutes les URL d'un sitemap.
  • Google ignore les valeurs <priority> et <changefreq>.
  • Google utilise la valeur <lastmod> si elle est cohérente et vérifiable (par exemple, en comparant la dernière modification de la page).
  • La position d'une URL dans un sitemap n'est pas importante. Google n'y explore pas les URL dans leur ordre d'apparition.

Envoyer votre sitemap à Google

Google ne vérifie pas le sitemap chaque fois qu'un site est exploré. Le sitemap n'est vérifié que la première fois que nous le détectons et, par la suite, uniquement lorsque vous nous envoyez une requête ping pour nous en informer. Assurez-vous de n'envoyer le sitemap ou une requête ping à Google que lorsque vous venez, respectivement, de créer ce sitemap ou de le mettre à jour, pas lorsqu'aucune modification n'y a été apportée.

Il existe plusieurs façons de nous permettre d'accéder à votre sitemap :

  • Nous l'envoyer dans le rapport de sitemaps de la Search Console.
  • Insérer la ligne suivante n'importe où dans le fichier robots.txt, en indiquant le chemin vers votre sitemap :
    Sitemap: http://example.com/sitemap_location.xml
  • Utiliser le service "ping" pour demander à Google d'explorer le sitemap. Envoyer une requête HTTP GET comme suit :
    http://www.google.com/ping?sitemap=<complete_url_of_sitemap>
    Exemple :
    http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

Dépannage des sitemaps

Consultez le Guide de dépannage des sitemaps.