Reunifica el contenido duplicado de tu web

lunes, 19 de octubre de 2009

Manejar el contenido duplicado dentro de tu propia web puede ser un gran reto. Los sitios web crecen; se les añaden, modifican y eliminan características; el contenido viene y va. Con el tiempo, y de forma no voluntaria, los sitios web pueden ir acumulando contenido duplicado en forma de diferentes URL que sirven un mismo contenido. Generalmente, el contenido duplicado en un sitio web no es algo problemático, aunque puede dificultar el rastreo y la indexación a los motores de búsqueda. Además, el PageRank y otros datos similares que se encuentran a través de enlaces entrantes pueden esparcirse por las páginas que no estén reconocidas como duplicados. Esto podría hacer que tu versión preferida aparezca posicionada en una posición inferior en los resultados de búsqueda de Google.

Pasos para tratar el contenido duplicado en tu web:

Reconoce qué es contenido duplicado:

El primer paso, y el más importante, es reconocer el contenido duplicado en tu sitio web. Una forma sencilla de hacer esto es tomar un fragmento de texto de una de tus páginas. Realiza una búsqueda limitando los resultados a las páginas de tu propio sitio web utilizando el operador site: . Si obtienes resultados múltiples para un mismo contenido, podrás comenzar la investigación por ahí.

Determina tu URL preferida:

Antes de solucionar cualquier cuestión de contenido duplicado, tendrás que determinar cuál es tu URL preferida. ¿Qué URL prefieres utilizar para ese contenido?

Sé coherente dentro de tu propio sitio web:

Una vez que hayas elegido tu URL preferida, asegúrate de usarla en todos los lugares posibles dentro de tu sitio web (incluyendo el archivo sitemap [inglés] ).

Usa redirecciones permanentes 301 cuando sea necesario y posible:

Si puedes, redirige las URL duplicadas a tu URL preferida utilizando un código de respuesta 301. Esto ayuda a los usuarios y a los motores de búsqueda a encontrar la URL preferida en caso de que visiten las URL duplicadas. Si tu sitio dispone de varios nombres de dominio, elige uno y utiliza una redirección 301 en los demás, asegurándote de que se transmite a los usuarios a la página adecuada, no sólo a la raíz del dominio. Si dispones de nombres de host con y sin "www", elige uno y utiliza la función Establecer dominio preferido en las Herramientas para webmasters para redirigir adecuadamente.

Aplica el atributo rel="canonical" en las páginas que puedas:

Cuando no es posible hacer una redirección 301, el atributo rel="canonical" puede ayudarnos a comprender mejor tu sitio y tus URL preferidas. El uso de este elemento de enlace también lo apoyan otros grandes motores de búsqueda, como Ask.com , Yahoo! y Bing [inglés] .

Utiliza la herramienta de gestión de parámetros de la URL en las Herramientas para webmasters de Google cuando sea posible:

Si todo o una parte del contenido duplicado de tu sitio web proviene de URL con parámetros de consulta, esta herramienta puede ayudarte a notificarte qué parámetros son importantes y cuáles son irrelevantes para tus URL. Puedes consultar información adicional acerca de esta herramienta en nuestra entrada sobre la herramienta .

¿Qué pasa con el archivo robots.txt?

Un elemento que falta en esta lista es el bloqueo de rastreo de contenido duplicado mediante el archivo robots.txt. Recomendamos no bloquear el acceso a contenido duplicado en tu sitio web, ya sea con un archivo robots.txt o con otros métodos . En lugar de esto, puedes utilizar el atributo rel="canonical" , la herramienta de gestión de parámetros de la URL o redirecciones 301. Si el acceso al contenido duplicado está completamente bloqueado, los motores de búsqueda tratarán por separado estas URL, como páginas únicas, ya que no pueden saber que se trata de URL diferentes para un mismo contenido. Es mejor que se puedan rastrear, pero que estén marcadas como duplicado, utilizando uno de los métodos que hemos recomendado. Si permites rastrear estas URL, el robot aprenderá las reglas de identificación de duplicados con tan sólo mirar la URL y se evitarán en gran medida nuevos rastreos innecesarios. Para los casos en los que el contenido duplicado nos hace rastrear tu sitio web en exceso, puedes ajustar la frecuencia de rastreo en las Herramientas para webmasters .

Esperamos que estos métodos te ayuden a dominar el contenido duplicado de tu sitio web. Puedes encontrar información sobre contenido duplicado en nuestro Centro de asistencia. Si tienes alguna pregunta, no dudes en unirte al Foro para webmasters para hablar del tema.