Errores soft 404

¿Qué es un error soft 404?

Un error soft 404 es una URL que devuelve una página en la que se informa al usuario de que la página que buscaba no existe y también muestra un código de estado 200 (petición correcta). En algunos casos, puede ser que devuelva una página con poco o ningún contenido; por ejemplo, una página casi sin rellenar o vacía.

¿Por qué es importante?

No recomendamos que se devuelva un código de petición correcta cuando se debería devolver un código 404/410 (página no encontrada) o 301 (página movida). Un código de petición correcta indica a los buscadores que hay una página real en esa URL; por lo tanto, la página puede aparecer en los resultados de búsqueda y los buscadores seguirán intentando rastrear esa URL inexistente, en lugar de dedicar el tiempo a rastrear páginas reales.

¿Qué debo hacer?

  • Si tu página ya no está disponible y no hay ninguna que la sustituya, debería devolver un código de respuesta 404 (página no encontrada) o 410 (página no disponible). Ambos códigos indican claramente a los navegadores y a los buscadores que la página no existe. También puedes hacer que se muestre al usuario una página 404 personalizada que, por ejemplo, contenga una lista con tus páginas web más populares o un enlace a tu página principal.
  • Si tu página web se ha movido o tiene una sustituta clara, debería devolver un código 301 (redirección permanente) para redirigir al usuario de forma adecuada.
  • Si crees que ha habido una equivocación al marcar que una de tus páginas devuelve un error soft 404, mediante la herramienta de inspección de URLs puedes examinar tanto el contenido renderizado como el código HTTP que se devuelve. Si la página renderizada está en blanco o prácticamente en blanco, puede ser que haga referencia a muchos recursos que no puedan cargarse (imágenes, secuencias de comandos y otros elementos no textuales), lo que se podría interpretar como un error soft 404. Hay varias razones por las que es posible que los recursos no se carguen; por ejemplo, puede que un archivo robots.txt los haya bloqueado, que la página tenga demasiados recursos o que estos sean demasiado grandes o de carga lenta. La herramienta de inspección de URLs debe indicar qué recursos no se pueden cargar y mostrar también la página renderizada activa.

Con la herramienta de inspección de URLs puedes comprobar si tu URL devuelve el código correcto.