¿Los errores 404 afectan a mi sitio?

Lunes, 2 de mayo del 2011

Así que, ahí estás, preocupándote por tu negocio, usando las Herramientas para webmasters de Google para comprobar cuán fantástico es tu sitio, pero... ¡espera! La página Errores de rastreo está llena de errores 404 (Not found). ¿El desastre es inminente?

Función de errores de rastreo de las Herramientas para webmasters

No temas, mi joven padawan. Echemos un vistazo a los errores 404 y cómo afectan (o no) a tu sitio:

P: ¿Afectan los errores 404 que aparecen en los informes de las Herramientas para webmasters de Google al posicionamiento de mi sitio?
R: Los errores 404 son una parte totalmente normal de la Web. Internet siempre está en constante cambio, nace contenido nuevo, muere contenido antiguo y, cuando lo hace, lo ideal es que devuelva un código de respuesta HTTP 404. Los buscadores son conscientes de ello. Tenemos errores 404 en nuestros propios sitios, como puedes ver arriba, y los encontramos por todas partes en la Web. De hecho, preferimos que cuando borres una página de tu sitio, te asegures de que devuelva un código adecuado de respuesta 404 o 410 (en lugar de un soft 404 ). Ten en cuenta que, para que nuestro rastreador pueda ver el código de respuesta HTTP de una URL, tiene que poder rastrearla. Si la URL está bloqueada por un archivo robots.txt, no podremos rastrearla ni ver su código de respuesta. El hecho de que algunas URLs de tu sitio ya no existan o devuelvan errores 404 no afecta al rendimiento de las demás URLs de tu sitio (las que devuelven códigos de estado 200 (Success)) en nuestros resultados de búsqueda.

P: Entonces, ¿los errores 404 no perjudican en absoluto a mi sitio?
R: El hecho de que algunas URLs de un sitio devuelvan el código 404 no perjudica por sí solo al sitio ni se tiene en cuenta en los resultados de búsqueda de Google. No obstante, puede haber otros motivos por los que debas abordar ciertos tipos de errores 404. Por ejemplo, si te interesan algunas de las páginas 404, debes descubrir por qué vemos errores 404 cuando las rastreamos. Si encuentras que una URL legítima está mal escrita, (www.example.com/awsome en lugar de www.example.com/awesome), es probable que alguien haya intentado enlazar a tu sitio y simplemente haya introducido una errata en la dirección. En lugar de devolver el código 404, puedes usar la redirección 301 para redirigir la URL mal escrita hacia la correcta y así capturar el tráfico procedente de ese enlace. También puedes asegurarte de que, cuando los usuarios lleguen a una página 404 de tu sitio, les ayudes a encontrar lo que buscan, en lugar de indicar únicamente "404 No encontrado".

P: Cuéntame más sobre los errores soft 404.
R: Un soft 404 ocurre cuando un servidor web devuelve un código de respuesta que no es 404 (o 410) para una URL que no existe. Un ejemplo común se da cuando el propietario de un sitio web quiere devolver una página 404 atractiva con información útil para sus usuarios y cree que, para publicar contenido para los usuarios, debe devolver un código de respuesta 200. No es así. Es posible devolver un código de respuesta 404 mientras se publica el contenido deseado. Otro ejemplo es cuando un sitio redirige cualquier URL desconocida a su página principal, en lugar de devolver errores 404. Ambos casos pueden tener un efecto perjudicial a la hora de comprender e indexar el sitio, así que recomendamos devolver los códigos de respuesta adecuados para el contenido que no existe. Ten en cuenta que solo porque una página indique "404 No encontrado" no significa que esté devolviendo un código de respuesta HTTP 404. Utiliza la función Explorar como el robot de Google de las Herramientas para webmasters de Google para comprobarlo. Si no sabes cómo configurar tu servidor para que devuelva el código correcto, consulta la documentación de ayuda de tu proveedor de alojamiento web.

P: ¿Cómo sé si una URL debería ser 404, 301 o 410?
R: Al eliminar una página de un sitio, piensa si el contenido se va a mover a otra parte, o si ese tipo de contenido ya no aparecerá más en el sitio. Si el contenido se va a mover a una URL nueva, deberías redirigir mediante 301 la URL anterior a la nueva. Así, cuando los usuarios accedan a la URL anterior para ver ese contenido, irán a parar directamente a un contenido relacionado con lo que buscan. Si vas a eliminar por completo el contenido y no va a haber ningún otro contenido en el sitio que cubra esa necesidad informativa, se debe devolver el código 404 o el código 410 cuando se intente acceder a la anterior URL. Por el momento, Google trata a 410 (Gone) de la misma forma que a 404 (Not found), por lo que no nos importa si devuelves uno o el otro.

P: La mayoría de mis errores 404 se deben a URLs extrañas que nunca han existido en mi sitio. ¿Qué pasa con ellas? ¿De dónde salen?
R: Si Google encuentra un enlace en alguna parte de la Web que dirija a una URL de tu dominio, es posible que intente rastrear ese enlace, tanto si el contenido existe realmente como si no. En este caso, tu servidor debería devolver un código 404 si no hay nada que ver ahí. Es posible que estos enlaces se deban a que alguien los ha escrito mal al enlazarlos, a algún tipo de error de configuración (si los enlaces se generan automáticamente; por ejemplo, mediante un CMS) o a los crecientes esfuerzos de Google por reconocer y rastrear enlaces insertados en JavaScript u otro contenido insertado. También pueden deberse a una comprobación rápida por nuestra parte para ver cómo gestiona tu servidor las URLs desconocidas, por nombrar algunos ejemplos. Si se muestran errores 404 en las Herramientas para webmasters de URLs que no existen en tu sitio, puedes ignorarlos. No sabemos qué URLs son importantes para ti y cuáles se supone que deben ser 404, por lo que te mostramos todos los errores 404 que detectamos en tu sitio y te permitimos decidir cuáles requieren tu atención.

P: Alguien ha hecho un raspado de datos de mi sitio y ha causado varios errores 404 en el proceso. Son URLs "reales" con otro código agregado, como https://www.example.com/images/kittens.jpg" width="100" height="300" alt="kittens"/>. ¿Afectará esto a mi sitio?
R: Por lo general, no tienes que preocuparte de que "enlaces rotos" como este dañen tu sitio. Entendemos que los propietarios de sitios web tienen poco o ningún control sobre las personas que raspan datos de sus sitios o que se enlazan a ellos de formas raras. Si dominas regex, puedes redirigir estas URLs, pero en general, no deberías preocuparte. Recuerda que, si crees que alguien está robando contenido original de tu sitio web, también puedes enviar una solicitud de retirada.

P: La semana pasada corregí todos los errores 404 que mostraban las Herramientas para webmasters, pero siguen apareciendo en mi cuenta. ¿Significa que no los he corregido bien? ¿Cuánto tardarán en desaparecer?
R: Fíjate en la columna "Detectado" en la página Errores de rastreo. En ella verás la fecha más reciente de detección de cada error. Si las fechas de la columna son anteriores al momento en que corregiste el error, significa que no han vuelto a detectarse desde esa fecha. Si las fechas son más recientes, significa que seguimos detectando esos errores 404 al rastrear la página.

Después de implementar una solución, puedes comprobar si nuestro rastreador ve el nuevo código de respuesta usando Explorar como el robot de Google. Prueba unas cuantas URLs. Si tienen buen aspecto, los errores deberían comenzar a desaparecer pronto de la lista de errores de rastreo.

P: ¿Puedo usar la herramienta de retirada de URLs de Google para que los errores 404 desaparezcan más rápidamente de mi cuenta?
R: No. La herramienta de retirada quita las URLs de los resultados de búsqueda de Google, no de la cuenta de Herramientas para webmasters. Está diseñada solo para atender solicitudes urgentes, y no es necesario usarla cuando una URL ya devuelve el código 404, ya que dicha URL dejará de aparecer en los resultados de búsqueda por si sola con el tiempo. Consulta la parte inferior de esta entrada de blog para obtener más detalles sobre la herramienta de retirada de URLs y lo que puede y no puede hacer por ti.

¿Quieres obtener más información sobre los errores 404? Consulta el contenido de la semana sobre 404 en nuestro blog, o visita el foro de ayuda para webmasters.