Cómo afectan a la Búsqueda de Google tanto los códigos de estado HTTP como los errores de red y de DNS

En esta página se explica cómo afectan a la Búsqueda de Google diferentes códigos de estado HTTP, errores de red y errores de DNS. Explicamos los 20 códigos de estado que más veces ha detectado el robot de Google en la Web, así como los errores de DNS y de red más destacados. No se incluye ninguna explicación de los códigos de estado que aparecen con menos frecuencia, como 418 (I'm a teapot). Todos los problemas que se mencionan en esta página hacen que aparezca un error o una advertencia en el informe "Estadísticas de rastreo" de Search Console.

Códigos de estado HTTP

Los códigos de estado HTTP los genera el servidor que aloja el sitio cuando responde a una solicitud de un cliente, como un navegador o un rastreador. Cada código de estado HTTP tiene un significado diferente, pero a menudo el resultado de la solicitud es el mismo. Por ejemplo, hay varios códigos de estado que indican la redirección, pero el resultado es el mismo.

Search Console genera mensajes de error de los códigos de estado del intervalo 4xx–5xx y de redirecciones fallidas (3xx). Si el servidor responde con un código de estado 2xx, es posible que el contenido recibido en la respuesta se tenga en cuenta en la indexación.

Códigos de estado HTTP
2xx (success)

Google tiene en cuenta el contenido para determinar su indexación. Si el contenido sugiere un error, como una página vacía o un mensaje de error, Search Console mostrará un error soft 404.

200 (success)

El robot de Google pasa el contenido al proceso de indexación. Es posible que los sistemas de indexación indexen el contenido, pero este proceso no está garantizado.

201 (created)
202 (accepted)

El robot de Google espera el contenido durante un tiempo limitado y luego envía lo que ha recibido a la indexación. El tiempo de espera depende del user-agent. Por ejemplo, es posible que el robot de Google para smartphones tenga un tiempo de espera diferente al del robot de Google para imágenes.

204 (no content)

El robot de Google indica a los sistemas de indexación que no ha recibido ningún contenido. Es posible que Search Console muestre un error soft 404 en el informe de cobertura de indexación del sitio.

3xx (redirects)

El robot de Google hace hasta 10 saltos de redirección. Si el rastreador no recibe contenido en 10 saltos, Search Console mostrará un error de redirección en el informe de cobertura de indexación del sitio. El número de saltos que sigue el robot de Google depende del user-agent. Por ejemplo, el límite del robot de Google para smartphones puede ser distinto al del robot de Google para imágenes.

301 (moved permanently)

El robot de Google sigue la redirección, y los sistemas de indexación la utilizan como un indicador importante de que la página de destino de la redirección debería ser la canónica.

302 (found)

El robot de Google sigue la redirección, y los sistemas de indexación la utilizan como un indicador poco importante de que la página de destino de la redirección debería ser la canónica.

303 (see other)
304 (not modified)

El robot de Google indica a los sistemas de indexación que el contenido es el mismo que la última vez que se rastreó. Estos sistemas pueden volver a calcular los indicadores de la URL, pero el código de estado no influye en la indexación.

307 (temporary redirect) Es equivalente a 302.
308 (moved permanently) Es equivalente a 301.
4xx (client errors)

Los sistemas de indexación de Google no tienen en cuenta en la indexación las URLs que devuelven un código de estado 4xx, y las URLs que ya están indexadas y devuelven un código de estado 4xx se retiran del índice.

400 (bad request)

Todos los errores 4xx, salvo 429, se tratan del mismo modo: el robot de Google indica a los sistemas de indexación que no existe el contenido.

Este proceso quita la URL de la indexación si ya se había indexado previamente. No se procesan las páginas 404 encontradas recientemente. La frecuencia de rastreo disminuye gradualmente.

401 (unauthorized)
403 (forbidden)
404 (not found)
410 (gone)
411 (length required)
429 (too many requests)

El robot de Google trata el código de estado 429 como un indicador de que el servidor está sobrecargado y lo considera un error del servidor.

5xx (server errors)

Los errores del servidor 5xx y 429 piden a los rastreadores de Google que ralenticen temporalmente el rastreo. Las URLs que ya están indexadas se conservan en el índice, pero se acaban retirando.

500 (internal server error)

El robot de Google reduce la frecuencia de rastreo del sitio, y esta disminución es proporcional al número de URLs que devuelve un error del servidor. Los sistemas de indexación de Google retiran del índice las URLs que devuelven constantemente un error del servidor.

502 (bad gateway)
503 (service unavailable)

Errores de red y de DNS

Los errores de red y de DNS tienen efectos rápidos y negativos en la presencia de una URL en la Búsqueda de Google. El robot de Google trata los tiempos de espera de la red, el reinicio de la conexión y los errores de DNS de forma similar a los errores del servidor 5xx. En el caso de que se produzcan errores de red, el rastreo empieza a ralentizarse inmediatamente, ya que un error de red indica que el servidor tal vez no pueda gestionar la carga del servicio. Las URLs que ya estén indexadas y que no sean accesibles se retirarán del índice de Google días más tarde. Puede que en Search Console se genere un mensaje por cada error que se detecte.

Depurar errores de red

Estos errores se producen antes de que Google empiece a rastrear una URL o mientras lo está haciendo. Dado que los errores pueden producirse antes de que el servidor pueda responder, de forma que no hay ningún código de estado que pueda sugerir problemas, el diagnóstico de estos errores puede ser más complicado. Para depurar errores de tiempo de espera y de reinicio de conexión, sigue estos pasos:

  • Consulta la configuración y los registros de tu cortafuegos. Puede que el conjunto de reglas de bloqueo que hay sea demasiado general. Asegúrate de que ninguna regla del cortafuegos bloquee direcciones IP del robot de Google.
  • Observa el tráfico de red. Con herramientas como tcpdump y Wireshark se podrán capturar y analizar paquetes TCP, así como buscar anomalías que dirijan a un componente de red o módulo de servidor específicos.
  • Si no detectas nada sospechoso, ponte en contacto con tu empresa de alojamiento.

El error puede encontrarse en cualquier componente del servidor que gestione el tráfico de red. Por ejemplo, las interfaces de red sobrecargadas pueden retirar paquetes que provocan que se agoten tiempos de espera (impiden que se establezca una conexión) y reiniciar conexiones (paquete RST enviado porque un puerto se ha cerrado por error).

Depurar errores de DNS

La mayoría de las veces, los errores de DNS se deben a una configuración incorrecta. Sin embargo, también es posible que haya alguna regla del cortafuegos bloqueando consultas de DNS del robot de Google. Para depurar errores de DNS, sigue estos pasos:

  • Inspecciona las reglas de tu cortafuegos. Asegúrate de que ninguna regla del cortafuegos bloquee ninguna de las direcciones IP del robot de Google y de que las solicitudes UDP y TCP estén habilitadas.
  • Consulta tus registros DNS. Comprueba que los registros A y CNAME dirigen a las direcciones IP y a los nombres de host correctos, respectivamente. Por ejemplo:
    dig +nocmd example.com a +noall +answer
    dig +nocmd www.example.com cname +noall +answer
  • Comprueba que todos los servidores de nombres dirigen a las direcciones IP correctas de tu sitio. Por ejemplo:
    dig +nocmd example.com ns +noall +answer
    example.com.    86400  IN  NS  a.iana-servers.net.
    example.com.    86400  IN  NS  b.iana-servers.net.
    dig +nocmd @a.iana-servers.net example.com +noall +answer
    example.com.    86400  IN  A  93.184.216.34
    dig +nocmd @b.iana-servers.net example.com +noall +answer
    ...
  • Si has hecho cambios en la configuración de DNS en las últimas 72 horas, es posible que tengas que esperar a que los cambios se propaguen por la red DNS mundial.
  • Si utilizas tu propio servidor DNS, asegúrate de que funciona correctamente y de que no esté sobrecargado.