Mitos y verdades sobre el rastreo

Prueba tus conocimientos sobre cómo Google rastrea sitios web.

Comprimir mis mapas del sitio puede aumentar mi presupuesto de rastreo
Verdadero
Falso
No lo hará. Los mapas del sitio comprimidos aún deben recuperarse del servidor, de modo que su envío no ahorrará demasiado tiempo de rastreo ni esfuerzo por parte de Google.
Google prefiere contenido más reciente, por lo que debería seguir modificando mi página.
Verdadero
Falso
En la Búsqueda de Google, el contenido se clasifica por su calidad, independientemente de qué tan antiguo sea. Crea y actualiza tu contenido según sea necesario, pero dar un aspecto artificialmente nuevo a las páginas mediante cambios triviales y la actualización de la fecha de la página no proporcionará un valor adicional.
Google prefiere el contenido antiguo (tiene más peso) al actualizado.
Verdadero
Falso
Si tu página es útil, lo es independientemente de que sea nueva o antigua.
Google prefiere URL claras y no le gustan los parámetros de búsqueda.
Verdadero
Falso
Podemos rastrear parámetros.
Cuanto más rápido se carguen y procesen las páginas, más podrá rastrear Google.
Verdadero
Verdadero, en el sentido de que una combinación de bots de rastreo de números y horas limita nuestros recursos. Si puedes entregarnos más páginas en un período limitado, podremos rastrear más de ellas. Sin embargo, es posible que dediquemos más tiempo a rastrear un sitio que tenga información más importante, ncluso si es más lento. Probablemente para ti sea más importante hacer tu sitio más rápido para los usuarios que aumentar tu cobertura de rastreo. Es mucho más fácil ayudar a Google a rastrear el contenido correcto que a rastrear todo el contenido cada vez. Ten en cuenta que el rastreo de un sitio implica la recuperación y el procesamiento del contenido. El tiempo dedicado a procesar la página cuenta tanto como el tiempo dedicado a solicitar la página. Por ese motivo, hacer que tus páginas se procesen más rápido también aumentará la velocidad de rastreo.
Falso
Los sitios pequeños no se rastrean con tanta frecuencia como los grandes.
Verdadero
Falso
Si un sitio tiene contenido importante que cambia con frecuencia, lo rastreamos con frecuencia, sin importar el tamaño.
Cuanto más cerca esté tu contenido de la página principal, más importante será para Google.
Verdadero
Parcialmente cierto
La página principal de tu sitio suele ser la más importante. Por lo tanto, es posible que las páginas vinculadas directamente a ella se consideren más importantes y, por lo tanto, se rastreen con mayor frecuencia. Sin embargo, eso no significa que esas páginas tendrán una clasificación más alta que otras de tu sitio.
Falso
El control de versiones de URL es una buena forma de alentar a Google a volver a rastrear mis páginas.
Verdadero
Parcialmente cierto
Es probable que el uso de una URL de versión sirva para incentivar a Google a volver a rastrearla antes de lo planeado, pero a menudo esto no es necesario y desperdiciará recursos de rastreo si la página no se actualiza realmente. Si usas URLs de versión para indicar contenido nuevo, te recomendamos que solo cambies la URL cuando el contenido de la página haya cambiado de manera significativa.
Falso
La velocidad del sitio y sus errores afectan mi presupuesto de rastreo.
Verdadero
Aumentar la velocidad de un sitio mejora la experiencia de los usuarios y, al mismo tiempo, aumenta la frecuencia de rastreo. Para los rastreadores de Google, un sitio veloz es una señal de servidores en buen estado, por lo que pueden obtener más contenido con la misma cantidad de conexiones. Por otra parte, una cantidad significativa de códigos de estado de respuesta HTTP 5xx (errores de servidor) o tiempos de espera de conexión indican lo opuesto, y se ralentiza el rastreo. Te recomendamos que prestes atención al informe de estadísticas de rastreo en Search Console y que mantengas una baja cantidad de errores de servidor.
Falso
El rastreo es un factor de clasificación en la Búsqueda de Google.
Verdadero
Falso
Mejorar la frecuencia de rastreo no necesariamente implicará mejores posiciones en los resultados de la Búsqueda de Google. Google usa muchos indicadores para clasificar los resultados y, aunque el rastreo es necesario para que una página aparezca en los resultados de la búsqueda, no es un indicador de clasificación.
Las URLs alternativas y el contenido incorporado se considerarán en el presupuesto de rastreo.
Verdadero
Por lo general, cualquier URL que rastree Googlebot se considerará en el presupuesto de rastreo de un sitio. Es posible que se deban rastrear URLs alternativas, como AMP o hreflang, además de contenido incorporado, como CSS y JavaScript, incluidas las recuperaciones de XHR, y estas consumirán el presupuesto de rastreo de un sitio.
Falso
Puedo controlar los rastreadores de Google con la regla "crawl-delay".
Verdadero
Falso
Los rastreadores de Google no procesan la regla no estándar "crawl-delay" de robots.txt.
La regla nofollow afecta el presupuesto de rastreo.
Verdadero
Parcialmente cierto
Cualquier URL que se rastree afecta el presupuesto de rastreo, por lo que incluso si tu página marca una URL como nofollow, se podrá rastrear si otra página de tu sitio o cualquier página de la Web no etiqueta el vínculo como nofollow.
Falso
Puedo usar noindex para controlar el presupuesto de rastreo.
Verdadero
Parcialmente cierto
Cualquier URL que se rastree afecta el presupuesto de rastreo, y Google debe rastrear la página para encontrar la regla noindex.

Sin embargo, noindex te ayudará a mantener el índice. Si quieres asegurarte de que esas páginas no terminen en el índice de Google, continúa usando noindex y no te preocupes por el presupuesto de rastreo. También es importante tener en cuenta que si quitas las URLs del índice de Google con noindex, rastreadores de Google puede enfocarse en otras URLs del sitio, lo que significa que noindex puede liberar indirectamente parte del presupuesto de rastreo para tu sitio a largo plazo.
Falso
Las páginas que publican códigos de estado HTTP 4xx desperdician el presupuesto de rastreo.
Verdadero
Falso
Las páginas que muestran 4xx códigos de estado HTTP (excepto 429) no desperdician el presupuesto de rastreo. Google intentó rastrear la página, pero recibió un código de estado y ningún otro contenido.