Simplificar la estructura de las URL

La estructura de la URL de un sitio debe ser lo más sencilla posible. Puedes organizar el contenido de modo que las URL se construyan de forma lógica e inteligible para los usuarios. Si es posible, utiliza palabras fáciles de leer en lugar de largos números de identificación. Por ejemplo, si buscas información sobre aviación, una URL como https://es.wikipedia.org/wiki/Aviación te ayuda a decidir hacer clic en el enlace. En cambio, una URL como http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1 resulta mucho menos atractiva para los usuarios.

Deberías usar signos de puntuación en las URL. Por ejemplo, http://www.example.com/vestido-verde.html nos resulta mucho más útil que http://www.example.com/vestidoverde.html. Te recomendamos emplear guiones normales (-) en lugar de guiones bajos (_) en tus URL.

Las URL demasiado complejas y, en particular, las que contienen varios parámetros, pueden provocar problemas en el rastreo al crear una gran cantidad de URL innecesarias que dirigen a contenido similar o idéntico de tu sitio. Como consecuencia, el robot de Google consume una cantidad de ancho de banda muy superior a la necesaria o no puede indexar todo el contenido del sitio.

Causas habituales de este problema

Que haya un número innecesariamente elevado de URLs puede deberse a diferentes motivos, como los siguientes:

  • Combinaciones de filtros en un conjunto de elementos. Muchos sitios ofrecen distintas vistas del mismo conjunto de elementos o resultados de búsqueda, lo que a menudo permite al usuario filtrar ese conjunto mediante criterios definidos. Esto puede servir, por ejemplo, para buscar hoteles en la playa. Cuando los filtros de esos sitios se combinan (por ejemplo, para buscar hoteles en la playa y con gimnasio), se dispara la cantidad de posibles URL (vistas de datos). Crear un gran número de listas de hoteles ligeramente distintas resulta innecesario, ya que al robot de Google le basta con acceder a un número reducido de esas listas para llegar a la página concreta de cada hotel. Por ejemplo:
    • Hoteles a "precios interesantes":
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • Hoteles a "precios interesantes" en la playa:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • Hoteles a "precios interesantes" en la playa y con gimnasio:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • Generación dinámica de documentos. Puede provocar que haya ligeros cambios debido a la presencia de contadores, marcas de tiempo o anuncios.
  • Parámetros problemáticos en URLs. Por ejemplo, los ID de sesión pueden crear una ingente cantidad de duplicados y un mayor número de URLs.
  • Parámetros para ordenar elementos. Algunos de los grandes sitios de compras ofrecen varias formas de ordenar los mismos elementos, lo que se traduce en un número de URL mucho mayor. Por ejemplo:
    http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance
       &search_category=25
  • Parámetros irrelevantes en la URL, como los parámetros de referencia. Por ejemplo:
    http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=
       OPD+Product+Page&cat=79
    http://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    http://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • Problemas de calendario. Un calendario generado dinámicamente puede crear enlaces con fechas anteriores y futuras sin restricciones en las fechas de inicio ni en las de finalización. Por ejemplo:
    http://www.example.com/calendar.php?d=13&m=8&y=2011
    http://www.example.com/calendar/cgi?2008&month=jan
  • Enlaces relativos rotos. A menudo, los enlaces relativos rotos pueden causar espacios infinitos. Este problema suele producirse debido a la repetición de elementos de rutas. Por ejemplo:
    http://www.example.com/index.shtml/discuss/category/school/061121/html/interview/
      category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
Cómo resolver este problema

Para impedir que haya problemas con la estructura de las URL, te recomendamos que tengas en cuenta las siguientes consideraciones:

  • Puedes utilizar un archivo robots.txt que bloquee el acceso del robot de Google a direcciones URL problemáticas. Normalmente, se trata de direcciones URL dinámicas, como las que generan resultados de búsqueda, o de direcciones URL que pueden crear espacios infinitos, como calendarios. El uso de expresiones regulares en el archivo robots.txt te permite bloquear fácilmente grandes cantidades de direcciones URL.
  • Si es posible, usa cookies mejor que IDs de sesión en las URL. Consulta más información en nuestras directrices para webmasters.
  • Si es posible, quita parámetros innecesarios de las URL para recortarlas.
  • Si tu sitio tiene un calendario infinito, añade un atributo nofollow a los enlaces que llevan a páginas de calendario futuras creadas dinámicamente.
  • Comprueba si tu sitio contiene enlaces relativos rotos.