Créer et envoyer un sitemap

Cette page explique comment créer un sitemap et l'envoyer à Google. En savoir plus sur les sitemaps

  1. Choisissez le format de sitemap que vous souhaitez utiliser.
  2. Créez le sitemap automatiquement ou manuellement.
  3. Mettez votre sitemap à la disposition de Google en l'ajoutant à votre fichier robots.txt ou en l'envoyant directement sur la Search Console.

Formats de sitemaps

Google accepte plusieurs formats de sitemaps.

Tous les formats du protocole sitemap standard sont acceptés. Pour le moment, Google ne tient pas compte de l'attribut <priority> dans les sitemaps.

Tous les formats imposent la même limite aux sitemaps : 10 Mo (sitemaps non compressés) et 50 000 URL. Si vous avez un fichier plus volumineux ou un nombre d'URL plus élevé, vous devez scinder votre liste en plusieurs sitemaps. Vous pouvez éventuellement créer un fichier d'index de sitemaps, c'est-à-dire un fichier qui redirige vers une liste de sitemaps, et nous envoyer ce fichier d'index unique. Vous pouvez nous envoyer plusieurs sitemaps et/ou fichiers d'index de sitemaps.

XML

Voici un exemple très simple de sitemap XML indiquant l'emplacement d'une URL :

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.example.com/foo.html</loc>
    <lastmod>2018-06-04</lastmod>
  </url>
</urlset>

Des exemples plus complexes et une documentation complète sont disponibles sur sitemaps.org.

Vous y trouverez des exemples de sitemaps spécifiant des pages alternatives et de sitemaps pour les actualités, les images ou les vidéos.

RSS, mRSS et Atom 1.0

Si vous possédez un blog doté d'un flux RSS ou Atom, vous pouvez envoyer l'URL du flux en tant que sitemap. La plupart des logiciels de développement de blogs peuvent créer des flux à votre place, mais ces flux ne fournissent des informations que sur les URL récentes.

  • Nous acceptons les flux RSS 2.0 et Atom 1.0.
  • Vous pouvez utiliser un flux mRSS (Media RSS) pour nous indiquer les détails du contenu vidéo de votre site.

Texte

Si votre sitemap contient exclusivement des URL de pages Web, vous pouvez nous transmettre un simple fichier texte avec une URL par ligne. Exemple :

http://www.example.com/file1.html
http://www.example.com/file2.html

Consignes pour les sitemaps sous forme de fichiers texte :

  • Encodez votre fichier en UTF-8.
  • N'insérez aucun élément autre que des URL dans le fichier de sitemap.
  • Vous pouvez donner au fichier texte le nom de votre choix, tant qu'il se termine par l'extension .txt (sitemap.txt, par exemple).

Extensions de sitemaps pour d'autres types de contenus

Nous acceptons les extensions de syntaxe de sitemaps pour les types de supports suivants. Utilisez ces extensions pour décrire des fichiers vidéo, des images et d'autres contenus de votre site difficilement analysables, et ainsi améliorer leur indexation.

Consignes générales relatives aux sitemaps

  • Utilisez des URL cohérentes et absolues. Nous explorons les URL indiquées à la lettre près. Par exemple, si votre site se trouve sur https://www.example.com/, n'indiquez pas l'URL https://example.com/ (www manquant) ou ./mypage.html (URL relative).
  • Un sitemap peut être publié n'importe où sur votre site, mais ne concerne que les descendants du répertoire parent. Par conséquent, un sitemap publié à la racine du site peut affecter tous les fichiers du site. Cet emplacement est recommandé.
  • N'incluez pas d'identifiant de session dans les URL de votre sitemap. Cela limite la double exploration de ces URL.
  • Signalez à Google les versions d'une URL dans une autre langue à l'aide des annotations hreflang.
  • Les fichiers sitemaps doivent être encodés en UTF-8 et les URL doivent utiliser les caractères d'échappement appropriés.
  • Scindez les sitemaps volumineux en plusieurs petits sitemaps : un sitemap peut contenir jusqu'à 50 000 URL et ne doit pas dépasser 50 Mo une fois décompressé. Utilisez un fichier d'index de sitemaps pour répertorier tous les sitemaps individuels, et envoyez-nous cet unique fichier au lieu de nous faire parvenir chaque sitemap séparément.
  • Ne répertoriez que les URL canoniques dans vos sitemaps. Si vous proposez deux versions d'une page, ne répertoriez dans le sitemap que la version que vous souhaitez voir apparaître dans les résultats de recherche. Si vous proposez deux versions d'un même site, par exemple avec et sans www, choisissez votre version préférée, ajoutez-y le sitemap et ajoutez rel=canonical ou des redirections sur l'autre site.
  • Si vous avez des URL différentes pour la version classique et la version mobile d'une page, nous vous recommandons de renvoyer vers une seule version. Toutefois, si vous avez besoin de renvoyer vers les deux URL, annotez-les pour indiquer la version classique et la version mobile.
  • Utilisez les extensions de sitemaps pour renvoyer vers d'autres types de supports, tels que des vidéos, des images et des actualités.
  • Si vous avez d'autres pages pour différentes langues ou régions, vous pouvez utiliser un attribut hreflang dans un sitemap ou les balises html pour indiquer ces URL.
  • Caractères non alphanumériques et non latins. Nous vous demandons d'utiliser impérativement un encodage UTF-8 pour votre fichier sitemap. En règle générale, vous pouvez définir ce paramètre au moment d'enregistrer le fichier. Comme pour tous les fichiers XML, les valeurs de données (URL comprises) doivent utiliser des codes d'échappement pour les caractères répertoriés dans le tableau ci-après. Un sitemap ne peut comporter que des caractères ASCII. Il ne peut pas contenir de caractères ASCII en majuscules ni certains codes de contrôle ou caractères spéciaux tels que * et {}. Si l'URL de votre sitemap contient ces caractères, vous obtiendrez une erreur lorsque vous demanderez son indexation.
    Caractère Symbole Code d'échappement
    Esperluette & &amp;
    Apostrophe ' &apos;
    Guillemets droits " &quot;
    Supérieur(e) à > &gt;
    Inférieur(e) à < &lt;

    En outre, toutes les URL (y compris celle de votre sitemap) doivent être encodées de façon à pouvoir être lues par le serveur Web sur lequel elles se trouvent et doivent utiliser les caractères d'échappement nécessaires. Cependant, si vous utilisez un quelconque script, outil ou fichier journal pour générer vos URL (plutôt que de les saisir manuellement), cette mise en forme est généralement automatique. Si vous envoyez votre sitemap et que vous recevez un message d'erreur indiquant que nous ne pouvons pas trouver certaines de vos URL, vérifiez que vos URL respectent bien la norme RFC-3986 pour les URI, la norme RFC-3987 pour les IRI et la norme XML.

    Voici l'exemple d'une URL utilisant un caractère non ASCII (ü), ainsi qu'un caractère nécessitant un code d'échappement (&) :

    http://www.example.com/ümlat.html&q=name

    Voici cette même URL, encodée en ISO-8859-1 (pour un hébergement sur un serveur utilisant cet encodage) et utilisant des caractères d'échappement d'URL :

    http://www.example.com/%FCmlat.html&q=name

    Voici cette même URL, encodée en UTF-8 (pour un hébergement sur un serveur utilisant cet encodage) et utilisant des caractères d'échappement d'URL :

    http://www.example.com/%C3%BCmlat.html&q=name

    Voici cette même URL, utilisant des caractères d'échappement d'entité :

    http://www.example.com/%C3%BCmlat.html&amp;q=name
  • N'oubliez pas que les sitemaps vous permettent de recommander à Google les pages que vous jugez essentielles. Google ne s'engage pas à explorer toutes les URL d'un sitemap.
  • Google ignore les valeurs <priority> et <changefreq>.
  • Google utilise la valeur <lastmod> si elle est cohérente et vérifiable (par exemple, en comparant la dernière modification de la page).
  • La position d'une URL dans un sitemap n'est pas importante. Google n'y explore pas les URL dans leur ordre d'apparition.

Créer un sitemap

Lorsque vous créez un sitemap, vous indiquez aux moteurs de recherche les URL que vous préférez afficher dans les résultats de recherche. Il s'agit des URL canoniques. Si vous avez le même contenu accessible sous différentes URL, sélectionnez celle que vous préférez et incluez-la dans le sitemap au lieu d'indiquer toutes les URL qui renvoient au même contenu.

Après avoir choisi les URL à inclure dans le sitemap, optez pour l'une des méthodes suivantes afin de créer un sitemap, en fonction de l'architecture et de la taille de votre site :

Laisser votre CMS générer un sitemap pour vous

Si vous utilisez un CMS, tel que WordPress, Wix ou Blogger, un sitemap a peut-être déjà été mis à la disposition des moteurs de recherche. Informez-vous sur la manière dont votre CMS génère des sitemaps ou sur la marche à suivre pour créer vous-même un sitemap si votre CMS ne s'en occcupe pas automatiquement. Par exemple, dans le cas de Wix, recherchez "wix sitemap".

Pour toutes les autres configurations de site, vous devez générer le sitemap vous-même.

Créer manuellement un sitemap

Pour les sitemaps dont le nombre d'URL est limité, vous pourrez créer un sitemap manuellement. Pour ce faire, ouvrez un éditeur de texte tel que Bloc-notes Windows ou Nano (Linux, MacOS), puis respectez la syntaxe décrite dans la section Formats de sitemaps.

Vous pouvez créer manuellement des sitemaps plus volumineux, mais cela est fastidieux.

Générer automatiquement un sitemap

Pour les sitemaps dont le nombre d'URL est conséquent, vous devez générer le sitemap. Plusieurs outils permettent de générer un sitemap. Cependant, l'approche la plus efficace consiste à recourir au logiciel de votre site Web afin qu'il le génère pour vous. Par exemple, vous pouvez extraire les URL de votre site à partir de sa base de données, puis les exporter vers l'écran ou vers le fichier statique de votre serveur Web. Vous aurez besoin de vos développeurs ou de votre responsable de serveur pour implémenter cette solution. Si vous manquez d'inspiration pour le code, consultez notre ancienne collection de générateurs de sitemaps tiers.

Notez que les sitemaps ne peuvent pas dépasser 50 Mo. En savoir plus sur la gestion des sitemaps volumineux

Envoyer votre sitemap à Google

Google ne vérifie pas le sitemap chaque fois qu'un site est exploré. Le sitemap n'est vérifié que la première fois que nous le détectons et, par la suite, uniquement lorsque vous nous envoyez une requête ping pour nous en informer. Assurez-vous de n'envoyer le sitemap ou une requête ping à Google que lorsque vous venez, respectivement, de créer ce sitemap ou de le mettre à jour, pas lorsqu'aucune modification n'y a été apportée.

Si vous avez mis à jour des pages dans le sitemap, marquez-les avec le champ <lastmod>. D'autres fichiers XML ont un champ similaire, comme <updated> pour Atom XML. Vous pouvez également apprendre à calculer cette date.

Il existe plusieurs façons de nous permettre d'accéder à votre sitemap :

  • Envoyez un sitemap à l'aide du rapport sur les sitemaps.
  • Utilisez l'outil ping. Dans votre navigateur ou dans la ligne de commande, envoyez une demande GET à cette adresse en spécifiant l'URL complète du sitemap. Assurez-vous que le fichier sitemap est accessible :
    https://www.google.com/ping?sitemap=FULL_URL_OF_SITEMAP

    Exemple :

    https://www.google.com/ping?sitemap=https://example.com/sitemap.xml
  • Insérez la ligne suivante n'importe où dans le fichier robots.txt, en indiquant le chemin vers votre sitemap. Nous le trouverons la prochaine fois que nous explorerons votre fichier robots.txt :
    Sitemap: https://example.com/my_sitemap.xml
  • Utilisez WebSub si vous utilisez Atom/RSS pour votre sitemap et que vous souhaitez diffuser vos modifications à d'autres moteurs de recherche, en plus de Google.

Dépannage des sitemaps

Consultez le Guide de dépannage des sitemaps.