Maintenir une structure d'URL simple

La structure des URL d'un site doit être aussi simple que possible. Organisez votre contenu de manière à donner aux URL une structure logique et facile à comprendre.

Remplacez, si possible, les ID trop longs par des termes compréhensibles.

Approche conseillée : optez pour des URL simples et descriptives.

http://en.wikipedia.org/wiki/Aviation

Approche déconseillée : utilisez des URL complexes et non descriptives.

http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

Pensez à utiliser des signes de ponctuation dans vos URL. Cela aide les utilisateurs et les moteurs de recherche à identifier plus facilement les concepts dans l'URL.

Approche conseillée : séparez les mots clés dans l'URL par des signes de ponctuation.

http://www.example.com/green-dress.html

Approche déconseillée : insérez les mots clés les uns après les autres, sans caractère de séparation, dans l'URL.

http://www.example.com/greendress.html

Nous vous recommandons d'utiliser des traits d'union (-) plutôt que des traits de soulignement (_) dans vos URL.

Approche recommandée : traits d'union (-) :

http://www.example.com/summer-clothing/filter?color-profile=dark-grey

Approche déconseillée : traits de soulignement (_) :

http://www.example.com/summer_clothing/filter?color_profile=dark_grey

Les URL trop complexes, notamment celles qui contiennent de nombreux paramètres, peuvent gêner l'exploration en créant inutilement un nombre élevé d'URL qui renvoient vers des contenus identiques ou similaires sur votre site. Dans ce cas, il est possible que Googlebot utilise beaucoup plus de bande passante que nécessaire ou ne parvienne pas à indexer tout le contenu de votre site.

Causes les plus fréquentes à l'origine de ce problème

La présence d'un nombre trop élevé d'URL peut provenir de divers facteurs. Exemples :

  • Filtrage supplémentaire d'un ensemble d'éléments. De nombreux sites offrent la possibilité d'afficher un même ensemble de données ou des résultats de recherche de différentes manières. Ces sites proposent généralement aux internautes de filtrer les données selon des critères définis (afficher les hôtels en bord de mer, par exemple). Lorsque l'application de plusieurs filtres est possible (par exemple, hôtels en bord de mer et disposant d'un centre de remise en forme), le nombre d'URL (affichages des données) croît significativement pour un même site. Or, la présence d'un nombre important de listes similaires entraîne des explorations redondantes, car une petite partie de ces listes suffirait à Googlebot pour atteindre tous les sites des hôtels proposés. Exemples :
    • Hôtels à "petit prix" :
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • Hôtels à "petit prix" en bord de mer :
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • Hôtels à "petit prix", en bord de mer et équipés d'un centre de remise en forme :
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • Création dynamique de documents. Ce procédé peut entraîner de légères modifications dues aux compteurs, à l'horodatage ou aux publicités.
  • Paramètres problématiques dans l'URL. Les ID de session, par exemple, peuvent générer une quantité considérable de doublons et augmenter le nombre d'URL.
  • Paramètres de tri. Certains grands sites de vente en ligne proposent à leurs utilisateurs diverses méthodes pour trier les produits, multipliant ainsi le nombre d'URL. Exemple :
    http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • Paramètres d'URL inadaptés, comme les paramètres de référence. Exemple :
    http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    http://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    http://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • Problèmes de calendrier. Un calendrier généré de manière dynamique peut créer des liens vers des dates ultérieures et antérieures sans appliquer de limitation sur les dates de début et de fin. Exemple :
    http://www.example.com/calendar.php?d=13&m=8&y=2011
    http://www.example.com/calendar/cgi?2008&month=jan
  • Liens associés non fonctionnels. Les liens associés non fonctionnels sont souvent à l'origine des espaces infinis. Ce problème survient généralement à cause de portions de chemin d'accès répétées. Exemple :
    http://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

Résoudre ce problème

Pour éviter tout problème au niveau de la structure des URL, nous vous recommandons de suivre les conseils ci-après :

  • Pensez à utiliser un fichier robots.txt pour bloquer l'accès de Googlebot à des URL problématiques. De manière générale, nous vous recommandons de bloquer les URL dynamiques, telles que les URL qui génèrent des résultats de recherche ou créent des espaces infinis, comme les calendriers. L'utilisation d'expressions rationnelles dans votre fichier robots.txt vous permet de bloquer facilement un nombre important d'URL.
  • Évitez autant que possible d'insérer des identifiants de session dans les URL. Remplacez-les par des cookies. Pour en savoir plus, consultez nos Consignes aux webmasters.
  • Dans la mesure du possible, réduisez la longueur de vos URL en supprimant les paramètres superflus.
  • Si votre site dispose d'un calendrier infini, ajoutez l'attribut nofollow aux liens permettant d'accéder aux futures pages de calendrier créées de façon dynamique.
  • Vérifiez que votre site ne comporte aucun lien associé non fonctionnel.