Simplificar la estructura de las URL

La estructura de las URL de un sitio debe ser lo más sencilla posible. Puedes organizar el contenido de modo que las URLs se construyan de forma lógica e inteligible para los usuarios. Si es posible, utiliza palabras fáciles de leer en vez de largos números de identificación. Por ejemplo, si buscas información sobre aviación, una URL como https://es.wikipedia.org/wiki/Aviación te ayuda a decidir si hacer clic en el enlace. En cambio, una URL como http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1 resulta mucho menos atractiva para los usuarios.

Deberías usar signos de puntuación en las URLs. Por ejemplo, http://www.example.com/vestido-verde.html nos resulta mucho más útil que http://www.example.com/vestidoverde.html. Te recomendamos emplear guiones normales (-) en lugar de guiones bajos (_) en tus URLs.

Las URLs demasiado complejas y, en particular, las que contienen varios parámetros, pueden provocar problemas en el rastreo al crear una gran cantidad de URLs innecesarias que dirigen a contenido similar o idéntico de tu sitio. Como consecuencia, el robot de Google consume una cantidad de ancho de banda muy superior a la necesaria o no puede indexar todo el contenido del sitio.

Causas habituales de este problema

Que haya un número innecesariamente elevado de URLs puede deberse a diferentes motivos, como los siguientes:

  • Combinaciones de filtros en un conjunto de elementos. Muchos sitios ofrecen distintas vistas del mismo conjunto de elementos o resultados de búsqueda, lo que a menudo permite al usuario filtrar ese conjunto mediante criterios definidos. Esto puede servir, por ejemplo, para buscar hoteles en la playa. Cuando los filtros de esos sitios se combinan (por ejemplo, para buscar hoteles en la playa y con gimnasio), se dispara la cantidad de posibles URLs (vistas de datos). Crear un gran número de listas de hoteles ligeramente distintas resulta innecesario, ya que al robot de Google le basta con acceder a un número reducido de esas listas para llegar a la página concreta de cada hotel. Por ejemplo:
    • Hoteles a "precios interesantes":
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • Hoteles a "precios interesantes" en la playa:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • Hoteles a "precios interesantes" en la playa y con gimnasio:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • Generar documentos de forma dinámica. Este método puede provocar pequeñas modificaciones debido a la presencia de contadores, marcas de tiempo o anuncios.
  • Parámetros problemáticos en la URL. Los IDs de sesión, por ejemplo, pueden crear enormes cantidades de duplicados y un mayor número de URLs.
  • Formas de ordenar los parámetros. Algunos sitios de compras grandes ofrecen varias formas de ordenar los mismos elementos, lo que se traduce en un número de URLs mucho mayor. Por ejemplo:
    http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • Parámetros irrelevantes en la URL, como los parámetros de referencia. Por ejemplo:
    http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    http://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    http://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • Problemas de calendario. Los calendarios generados dinámicamente pueden crear enlaces a fechas pasadas y futuras sin ninguna restricción sobre las fechas de inicio ni de finalización. Por ejemplo:
    http://www.example.com/calendar.php?d=13&m=8&y=2011
    http://www.example.com/calendar/cgi?2008&month=jan
  • Enlaces relativos rotos. A menudo, los enlaces relativos rotos pueden causar espacios infinitos. Este problema suele producirse debido a la repetición de elementos de rutas. Por ejemplo:
    http://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

Solucionar este problema

Para impedir que haya problemas con la estructura de las URL, te recomendamos que tengas en cuenta las siguientes consideraciones:

  • Puedes utilizar un archivo robots.txt que bloquee el acceso del robot de Google a las direcciones URL problemáticas. Normalmente, se trata de direcciones URL dinámicas, como las que generan resultados de búsqueda, o de direcciones URL que pueden crear espacios infinitos, como calendarios. El uso de expresiones regulares en el archivo robots.txt te permite bloquear fácilmente grandes cantidades de direcciones URL.
  • Si es posible, usa cookies en vez de IDs de sesión en las URLs. Consulta más información en nuestras directrices para webmasters.
  • Si es posible, quita parámetros innecesarios de las URLs para acortarlas.
  • Si tu sitio tiene un calendario infinito, añade un atributo nofollow a los enlaces que lleven a páginas de calendario futuras creadas dinámicamente.
  • Comprueba si tu sitio contiene enlaces relativos rotos.