Puedes impedir que una página aparezca en la Búsqueda de Google si incluyes una metaetiqueta noindex
en el código HTML de la página o devuelves un encabezado noindex
en la solicitud HTTP. Así, cuando el robot de Google vea la etiqueta o el encabezado al volver a rastrear la página, la eliminará de los resultados de búsqueda, independientemente de si otros sitios web tienen enlaces a ella.
noindex
es útil si no tienes acceso raíz al servidor, ya que te permite controlar el acceso a tu sitio web página por página.
Implementar noindex
Puedes implementar noindex
de dos formas: como metaetiqueta o como encabezado de respuesta HTTP. Ambos métodos tienen el mismo efecto; simplemente elige el que mejor se adapte a tu sitio web.
Etiqueta <meta>
Para impedir que los rastreadores web de la mayoría de los buscadores indexen una página de tu sitio web, coloca esta metaetiqueta en la sección <head>
de la página:
<meta name="robots" content="noindex">
Si solo quieres impedir que lo hagan los rastreadores web de Google, incluye esta otra metaetiqueta:
<meta name="googlebot" content="noindex">
Ten en cuenta que es posible que los rastreadores web de algunos buscadores interpreten la directiva noindex
de maneras diferentes, por lo que puede que la página siga apareciendo en sus resultados.
Más información sobre la metaetiqueta noindex
Ayúdanos a detectar tus metaetiquetas
Para ver las metaetiquetas de una página, primero tenemos que rastrearla. Por tanto, si tu página sigue apareciendo en los resultados, probablemente sea porque no hemos rastreado tu sitio web desde que añadiste la metaetiqueta. Puedes solicitar que Google vuelva a rastrear tu página con la herramienta de inspección de URLs. Otro de los motivos puede ser que un archivo robots.txt esté bloqueando el acceso de los rastreadores web de Google a esa URL y, por tanto, no podamos ver la etiqueta. Para desbloquear la página y que los rastreadores de Google puedan acceder, debes modificar el archivo robots.txt. Puedes modificarlo y probarlo con la herramienta Probador de robots.txt.
Encabezado de respuesta HTTP
En lugar de usar una metaetiqueta, puedes devolver un encabezado X-Robots-Tag
con los valores noindex
o none
en tu respuesta. A continuación se muestra un ejemplo de una respuesta HTTP con un encabezado X-Robots-Tag
que indica a los rastreadores que no indexen una página:
HTTP/1.1 200 OK (…) X-Robots-Tag: noindex (…)