Cómo evitar que se cree contenido duplicado.

En general, el concepto de contenido duplicado hace referencia a bloques sustanciales de contenido, dentro de dominios o entre varios dominios, que son perceptiblemente similares o idénticos a otros contenidos. En su mayoría, no tienen fines maliciosos. A continuación, se incluyen algunos ejemplos de contenido duplicado no engañoso:

  • Foros de discusión que generan páginas, tanto regulares como básicas, dirigidas a dispositivos móviles
  • Artículos de una tienda que se muestran en varias URL diferentes o que están vinculados a distintas URL
  • Versiones de páginas web solo para imprimir

Si tu sitio incluye varias páginas con contenido idéntico en su mayoría, existen varias formas de indicar a Google cuál es tu URL preferida. (Esto se denomina "canonicalización"). Obtén más información al respecto.

Sin embargo, en algunos casos, el contenido está duplicado a propósito en distintos dominios con el fin de manipular la clasificación del motor de búsqueda o aumentar el tráfico. Algunas prácticas engañosas como esa pueden generar una mala experiencia del usuario, como cuando un visitante ve prácticamente el mismo contenido repetido en un conjunto de resultados de la búsqueda.

Google se esfuerza por indexar y mostrar páginas que contienen información diferente. Este filtro implica que, por ejemplo, si tu sitio tiene una versión "normal" y una "para imprimir" de cada artículo, y ninguna está bloqueada con una metaetiqueta noindex, elegiremos una de ellas. En algunos casos excepcionales en los que Google perciba que se podría estar mostrando contenido duplicado con la intención de manipular la clasificación y engañar a los usuarios, también haremos las modificaciones correspondientes en la indexación y clasificación de los sitios involucrados. Como resultado, es posible que se vea afectada la clasificación del sitio o que se quite el sitio por completo del índice de Google; en ese caso, dejará de aparecer en los resultados de la búsqueda.

Hay algunas medidas que puedes tomar para solucionar de manera proactiva los problemas relacionados con contenido duplicado y garantizar que los visitantes vean el contenido que quieres mostrar.

  • Usa redireccionamientos 301: si reestructuraste tu sitio, usa redireccionamientos 301 ("RedirectPermanent") en el archivo .htaccess para redireccionar de manera conveniente a los usuarios, a Googlebot y otras arañas. (En Apache, puedes hacerlo con un archivo .htaccess y, en IIS, en la consola del administrador).
  • Sé coherente: trata de que tus vínculos internos sean coherentes. Por ejemplo, no incluyas un vínculo a http://www.example.com/page/, http://www.example.com/page y http://www.example.com/page/index.htm.
  • Usa dominios de nivel superior: para ayudarnos a publicar la versión más adecuada de un documento, usa dominios de nivel superior siempre que sea posible para procesar contenido específico de cada país. Por ejemplo, es más probable que sepamos que http://www.example.de incluye contenido para Alemania, que http://www.example.com/de o http://de.example.com.
  • Realiza la distribución con cuidado: si distribuyes tu contenido en otros sitios, Google siempre mostrará la versión que creemos que es la más adecuada para los usuarios en cada búsqueda determinada, que puede o no ser la versión que prefieres. Sin embargo, conviene garantizar que cada sitio en el que se distribuye tu contenido incluya un vínculo al artículo original. También puedes pedirles a aquellos que usan tu material distribuible que utilicen una metaetiqueta noindex para evitar que los motores de búsqueda indexen su versión del contenido.
  • Minimiza el uso de texto repetitivo: Por ejemplo, en lugar de incluir un texto largo de derechos de autor al final de cada página, incluye un resumen breve y un vínculo a la página con más detalles. Además, puedes usar la herramienta de organización de parámetros para especificar cómo quieres que Google trate los parámetros de URL.
  • Evita publicar código auxiliar: A los usuarios no les gusta ver páginas "vacías". Por eso, cuando sea posible, evita los marcadores de posición. Por ejemplo, no publiques páginas que no incluyan contenido real. Si creas páginas de marcador de posición, usa la metaetiqueta noindex para bloquear su indexación.
  • Comprende cómo se usa el sistema de administración de contenido: Asegúrate de familiarizarte con cómo se muestra el contenido en tu sitio web. A menudo, los blogs, foros y sistemas relacionados muestran el mismo contenido en múltiples formatos. Por ejemplo, una entrada de blog puede aparecer en la página principal de un blog, en una página del archivo y en una página de otras entradas con la misma etiqueta.
  • Minimiza el contenido similar: Si tienes muchas páginas que son similares, piensa en expandir cada página o consolidar todas en una. Por ejemplo, si tienes un sitio de viajes con páginas separadas para dos ciudades, pero la misma información en ambas, puedes combinarlas en una sola sobre las dos ciudades o bien expandirlas para que incluyan contenido único acerca de cada ciudad.

Google no recomienda bloquear el acceso del rastreador al contenido duplicado de tu sitio web, ya sea con un archivo robots.txt o algún otro método. Si los motores de búsqueda no pueden rastrear páginas con contenido duplicado, no podrán detectar de manera automática que esas URL dirigen al mismo contenido y, por lo tanto, deberán tratarlas como páginas únicas separadas. Una mejor solución es permitir que los motores de búsqueda rastreen esas URL, pero marcarlas como duplicadas mediante el elemento de vínculo rel="canonical", la herramienta de organización de parámetros de URL o los redireccionamientos 301. En los casos en que el contenido duplicado nos lleve a rastrear demasiado tu sitio web, también podrás modificar la configuración de la frecuencia de rastreo en Search Console.

El contenido duplicado en un sitio no es motivo suficiente para tomar medidas en ese sitio, a menos que parezca que el fin del contenido duplicado es engañar y manipular los resultados del motor de búsqueda. Si tu sitio tiene problemas relacionados con contenido duplicado y no sigues las sugerencias detalladas arriba, nos tomamos el trabajo de seleccionar una versión del contenido para mostrar en nuestros resultados de la búsqueda.

Sin embargo, si en nuestra revisión se indicó que realizaste prácticas engañosas y se quitó tu sitio de nuestros resultados de la búsqueda, analiza tu sitio con atención. Si se quitó tu sitio de nuestros resultados de la búsqueda, consulta los Lineamientos para Webmasters para obtener más información al respecto. Después de hacer los cambios pertinentes y de asegurarte de que tu sitio ya no infrinja los lineamientos, envía una solicitud para que lo reconsideremos.

En muy pocas situaciones, nuestro algoritmo puede seleccionar una URL de un sitio externo que esté alojando tu contenido sin tu permiso. Si crees que otro sitio duplica tu contenido incumpliendo la ley de derechos de autor, puedes comunicarte con el host del sitio para solicitar que lo quite. Además, puedes solicitar que Google quite esa página de los resultados de la Búsqueda. Para hacerlo, debes presentar una solicitud en virtud de la ley Digital Millennium Copyright Act.