¿Los errores 404 afectan mi sitio?

Lunes, 2 de mayo de 2011

Estás usando las Herramientas para webmasters sin mayores preocupaciones para verificar lo genial que es tu sitio… Pero ¡espera! La página Errores de rastreo está llena de errores 404 (Not found). ¿El desastre es inminente?

La función Errores de rastreo de las Herramientas para webmasters

No temas, mi joven padawan. Echemos un vistazo a los errores 404 y cómo afectan (o no) a tu sitio:

P: ¿Los errores 404 que se informan en las Herramientas para webmasters afectan la clasificación de mi sitio?
R: Los errores 404 son una parte normal de la Web. Internet siempre está cambiando, nace contenido nuevo, muere contenido antiguo y, cuando lo hace (idealmente), muestra un código de respuesta HTTP 404. Los motores de búsqueda son conscientes de esto; tenemos errores 404 en nuestros propios sitios, como se puede ver arriba, y los encontramos en toda la Web. De hecho, preferimos que, cuando elimines una página del sitio, te asegures de que muestre un código de respuesta apropiado 404 o 410 (en lugar de un "soft 404"). Ten en cuenta que, para que nuestro rastreador pueda ver el código de respuesta HTTP de una URL, debe poder rastrearla (si tu archivo robots.txt bloquea la URL, no podremos rastrearla ni ver su código de respuesta). El hecho de que algunas URLs en tu sitio ya no existan ni muestren errores 404 no afecta el rendimiento de las otras URLs de tu sitio (las que muestran códigos de estado 200 (Success)) en nuestros resultados de la búsqueda.

P: Entonces ¿los errores 404 no afectan a mi sitio web en absoluto?
R: Si algunas URLs de tu sitio presentan un error 404, este hecho no te afecta ni te limita en los resultados de la búsqueda de Google. Sin embargo, puede haber otros motivos por los que te recomendamos abordar ciertos tipos de errores 404. Por ejemplo, si te interesan algunas de las páginas que presentan errores 404, debes analizar por qué vemos errores 404 cuando las rastreamos. Si ves un error ortográfico en una URL legítima (www.example.com/awsome en lugar de www.example.com/awesome), es probable que alguien haya tenido la intención de vincularse contigo y que haya cometido un error tipográfico. En lugar de mostrar un error 404, puedes redireccionar con 301 la URL mal escrita a la URL correcta y capturar el tráfico previsto desde ese vínculo. También puedes asegurarte de que, cuando los usuarios lleguen a una página de error 404 en tu sitio, los ayudes a encontrar lo que buscaban en lugar de solo mostrar el mensaje "404 Not found".

P: Cuéntame más sobre los "errores soft 404".
R: Un soft 404 se produce cuando un servidor web muestra un código de respuesta distinto de 404 (o 410) para una URL que no existe. Un ejemplo común es cuando el propietario de un sitio quiere mostrar una página 404 con información útil para sus usuarios y considera que, para publicar contenido para los usuarios, debe mostrar un código de respuesta 200. Pero no es así. Puedes mostrar un código de respuesta 404 mientras publicas el contenido que desees. Otro ejemplo es cuando un sitio redirecciona cualquier URL desconocida a su página principal, en lugar de mostrar errores 404. Ambos casos pueden tener efectos negativos en nuestra interpretación y la indexación de tu sitio, por lo que te recomendamos asegurarte de que tu servidor muestre los códigos de respuesta adecuados para el contenido inexistente. Ten en cuenta que solo porque una página dice "404 Not found", no significa que en realidad muestre un código de respuesta HTTP 404. Usa la función Explorar como Googlebot en Herramientas para webmasters para volver a verificar. Si no sabes cómo configurar tu servidor para que muestre los códigos de respuesta correctos, consulta la documentación de ayuda de tu host web.

P: ¿Cómo sé si una URL debe ser 404, 301 o 410?
R: Cuando quites una página de tu sitio, piensa si ese contenido se trasladará a otra parte o si ya no planeas incluir ese tipo de contenido en tu sitio. Si mueves ese contenido a una URL nueva, debes redireccionar con 301 la URL anterior a la nueva URL; de esa manera, cuando los usuarios accedan a la URL anterior en busca de ese contenido, se los redireccionará automáticamente a información relevante para lo que buscaban. Si decides deshacerte por completo de ese contenido y no tienes nada en tu sitio que pueda satisfacer la misma necesidad del usuario, la URL anterior debería mostrar un 404 o 410. Por el momento, Google trata a 410 (Gone) de la misma manera que a 404 (Not found), por lo que no nos importa si muestras uno o el otro.

P: La mayoría de mis errores 404 son para URLs extrañas que nunca existieron en mi sitio. ¿Por qué sucede esto? ¿De dónde provienen?
R: Si Google encuentra un vínculo en algún lugar de la Web que dirija a una URL de tu dominio, es posible que intente rastrear ese vínculo, independientemente de que exista contenido o no. Cuando lo hace, tu servidor debe mostrar un 404 si no hay nada que encontrar. Es posible que estos vínculos se produzcan por un error tipográfico al vincularse contigo, algún tipo de configuración incorrecta (si los vínculos se generan automáticamente, por ejemplo, mediante un CMS) o debido al aumento de esfuerzos de Google por reconocer y rastrear vínculos incorporados en JavaScript o algún otro contenido incorporado; o pueden ser parte de una verificación rápida por nuestro lado para ver cómo tu servidor maneja las URLs desconocidas, por nombrar algunos ejemplos. Si ves errores 404 informados en las Herramientas para webmasters sobre URLs que no existen en tu sitio, puedes ignorarlos de manera segura. No sabemos qué URLs son importantes para ti ni cuáles se supone que deben mostrar un 404, por lo que te mostramos todos los errores 404 que encontramos en tu sitio y te permitimos decidir cuáles requieren tu atención.

P: Alguien hizo scraping de mi sitio y causó una gran cantidad de errores 404 en el proceso. Son URLs "reales" con otro código agregado, como https://www.example.com/images/kittens.jpg" width="100" height="300" alt="kittens"/>. ¿Esto afectará mi sitio?
R: Por lo general, no debes preocuparte de que los "vínculos rotos" dañen a tu sitio. Entendemos que los propietarios de sitios tienen poco o ningún control sobre las personas que hacen scraping de sus sitios o que se vinculan a ellos de formas extrañas. Si eres experto con regex, podrías considerar redireccionar estas URLs, pero, en general, no vale la pena preocuparse. Recuerda que también puedes presentar una solicitud de eliminación cuando creas que alguien roba contenido original de tu sitio web.

P: La semana pasada corregí todos los errores 404 que informaron las Herramientas para webmasters, pero aún aparecen en mi cuenta. ¿Esto significa que no los solucioné correctamente? ¿Cuánto tardarán en desaparecer?
R: Observa la columna "Detectados" en la página Errores de rastreo; esta es la fecha más reciente en la que detectamos cada error. Si las fechas de esa columna son anteriores a la fecha en que corregiste los errores, significa que no encontramos estos errores desde esa fecha. Si las fechas son más recientes, significa que seguimos viendo estos errores 404 cuando hacemos el rastreo.

Después de implementar una solución, puedes verificar si nuestro rastreador está viendo el nuevo código de respuesta mediante Explorar como Googlebot. Prueba algunas URLs y, si se ven bien, estos errores deberían comenzar a desaparecer pronto de tu lista de errores de rastreo.

P: ¿Puedo usar la herramienta de eliminación de URL de Google para hacer que los errores 404 desaparezcan de mi cuenta más rápido?
R: No. La herramienta de eliminación de URL las quita de los resultados de la búsqueda de Google, no de la cuenta de Herramientas para webmasters. Está diseñada solo para solicitudes de eliminación urgentes, y no es necesario usarla cuando una URL ya muestra un 404, ya que una URL así desaparecerá naturalmente de nuestros resultados de búsqueda con el tiempo. Consulta la mitad inferior de esta entrada de blog para obtener más detalles sobre lo que la herramienta de eliminación de URL puede y no puede hacer por ti.

¿Aún quieres saber más acerca de los errores 404? Visita la semana 404 en nuestro blog o visita el Foro de ayuda para webmasters.