Bonnes pratiques concernant la structure des URL pour la recherche Google
Pour vous assurer que la recherche Google peut explorer votre site efficacement, utilisez une structure d'URL explorable qui répond aux exigences suivantes. Si vos URL ne répondent pas aux critères suivants, la recherche Google explorera probablement votre site de manière inefficace, ce qui peut inclure des taux d'exploration extrêmement élevés ou nuls.
Exigences pour une structure d'URL explorable | |||||||
---|---|---|---|---|---|---|---|
Respectez la norme IETF STD 66 |
La recherche Google prend en charge les URL conformes à la norme IETF 66. Les caractères définis par la norme comme étant réservés doivent être encodés en pourcent. |
||||||
N'utilisez pas de fragments d'URL pour modifier le contenu |
N'utilisez pas de fragments pour modifier le contenu d'une page, car la recherche Google n'accepte généralement pas les fragments d'URL. Voici un exemple de fragment d'URL: https://example.com/#/potatoes Si vous utilisez JavaScript pour modifier le contenu, utilisez l'API History à la place. |
||||||
Utilisez un encodage courant pour les paramètres d'URL |
Lorsque vous spécifiez des paramètres d'URL, utilisez l'encodage courant suivant : un signe égal (
|
Simplifiez la compréhension de votre structure d'URL
Pour aider la recherche Google (et vos utilisateurs) à mieux comprendre votre site, nous vous recommandons de créer une structure d'URL simple en appliquant les bonnes pratiques suivantes, dans la mesure du possible.
Bonnes pratiques | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Utilisez des URL descriptives |
Remplacez, si possible, les ID trop longs par des termes compréhensibles.
|
||||||||||
Utilisez la langue de votre audience |
Utilisez des mots dans la langue de votre audience dans l'URL (et, le cas échéant, des mots translittérés). Par exemple, si votre audience effectue des recherches en allemand, utilisez des mots allemands dans l'URL : https://example.com/lebensmittel/pfefferminz Si elle effectue des recherches en japonais, utilisez des mots japonais dans l'URL : https://example.com/ペパーミント |
||||||||||
Utilisez l'encodage UTF-8 si nécessaire |
Lorsque vous créez des liens vers des pages de votre site, utilisez l'encodage UTF-8 dans les attributs
|
||||||||||
Utilisez des traits d'union pour séparer les mots |
Dans la mesure du possible, nous vous recommandons de séparer les mots dans vos URL. Plus précisément, nous vous recommandons d'utiliser des traits d'union (
|
||||||||||
Utilisez le moins de paramètres possible |
Dans la mesure du possible, réduisez la longueur de vos URL en supprimant les paramètres superflus (c'est-à-dire les paramètres qui ne modifient pas le contenu). | ||||||||||
N'oubliez pas que les URL sont sensibles à la casse |
Comme tout autre client HTTP respectant la norme IETF 66, la gestion des URL par la recherche Google est sensible à la casse (par exemple, Google traite /APPLE et /apple comme des URL distinctes avec leur propre contenu). Si les majuscules et minuscules d'une URL sont traitées de la même manière par votre serveur Web, convertissez tout le texte dans la même casse. Cela aidera Google à déterminer plus facilement que les URL font référence à la même page.
|
||||||||||
Pour les sites multirégionaux |
Si votre site concerne plusieurs régions, envisagez d'utiliser une structure d'URL facilitant le ciblage géographique. Pour découvrir d'autres exemples de structures d'URL, consultez la page Utiliser des URL spécifiques aux paramètres régionaux. Approche conseillée (utilisation d'un domaine spécifique à un pays) : https://example.de Approche déconseillée (utilisation d'un sous-répertoire spécifique à un pays avec un domaine de premier niveau générique) : https://example.com/de/ |
Éviter les problèmes courants liés aux URL
Les URL trop complexes, notamment celles qui contiennent de nombreux paramètres, peuvent gêner l'exploration en créant inutilement un nombre élevé d'URL qui renvoient vers des contenus identiques ou similaires sur votre site. Dans ce cas, il est possible que Googlebot utilise beaucoup plus de bande passante que nécessaire ou ne parvienne pas à indexer tout le contenu de votre site.
La présence d'un nombre trop élevé d'URL peut provenir de divers facteurs, notamment :
Problèmes courants | |
---|---|
Filtrage supplémentaire d'un ensemble d'éléments |
De nombreux sites offrent la possibilité d'afficher un même ensemble de données ou des résultats de recherche de différentes manières. Ces sites proposent généralement aux internautes de filtrer les données selon des critères définis (afficher les hôtels en bord de mer, par exemple). Lorsque l'application de plusieurs filtres est possible (par exemple, hôtels en bord de mer et disposant d'une salle de sport), le nombre d'URL (affichages des données) croît significativement pour un même site. Or, la présence d'un nombre important de listes similaires entraîne des explorations redondantes, car une petite partie de ces listes suffirait à Googlebot pour atteindre tous les sites des hôtels proposés. Exemples :
|
Paramètres non pertinents |
Les paramètres d'URL non pertinents peuvent entraîner la création d'un grand nombre d'URL, par exemple:
Envisagez d'utiliser un fichier robots.txt pour bloquer l'accès de Googlebot à ces URL problématiques. |
Problèmes de calendrier |
Un calendrier généré de manière dynamique peut créer des liens vers des dates ultérieures et antérieures sans appliquer de limitation sur les dates de début et de fin. Exemple : https://example.com/calendar.php?d=13&m=8&y=2011
Si votre site dispose d'un calendrier infini, ajoutez l'attribut |
Liens associés non fonctionnels |
Placer un lien associé au parent sur la mauvaise page peut créer des espaces infinis si votre serveur ne répond pas avec le code d'état HTTP approprié pour les pages inexistantes. Par exemple, un lien associé au parent tel que <a href="../../category/stuff">...</a> sur https://example.com/category/community/070413/html/FAQ.htm peut générer des URL fictives telles que https://example.com/category/community/category/stuff .
Pour résoudre ce problème, utilisez des URL associées à la racine dans vos liens (et non associées au parent).
|
Résoudre les problèmes de structure d'URL liés à l'exploration
Si vous constatez que la recherche Google explore ces URL problématiques, nous vous recommandons les solutions suivantes :
- Pensez à utiliser un fichier robots.txt pour bloquer l'accès de Googlebot aux URL problématiques. De manière générale, nous vous recommandons de bloquer les URL dynamiques, telles que les URL qui génèrent des résultats de recherche ou créent des espaces infinis, comme les calendriers, ainsi que les fonctions de tri et de filtrage.
- Si votre site comporte une navigation à facettes, découvrez comment gérer l'exploration de ces URL de navigation à facettes.