Crear y enviar sitemaps

En este artículo se explica cómo crear sitemaps y ponerlos a disposición de Google. Más información sobre los sitemaps

  1. Elige qué páginas de tu sitio quieres que Google rastree y determina la versión canónica de cada una.
  2. Decide el formato de sitemap que quieres utilizar y si vas a crear tu sitemap manualmente o con alguna herramienta de terceros.
  3. Pon el sitemap a disposición de Google añadiéndolo a tu archivo robots.txt o enviándolo directamente a Search Console.

Formatos de sitemaps

Google admite diferentes formatos de sitemaps, que se describen en este apartado, aunque todos deben seguir el protocolo de sitemap estándar. Por el momento, Google no utiliza el atributo <priority> en los sitemaps.

Sea cual sea el formato que se use, los sitemaps no pueden tener un tamaño superior a 50 MB sin comprimir ni incluir más de 50.000 URLs. Si tienes un archivo más grande o con más URLs, tienes que dividirlo en varios sitemaps. En ese caso, puedes crear un índice de sitemap (un archivo que lleva a una lista de sitemaps) y enviar solo ese archivo a Google. Puedes enviar varios sitemaps o archivos de índices de sitemaps a Google.

XML

A continuación se muestra un sitemap XML muy básico que incluye la ubicación de una sola URL:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/foo.html</loc>
<lastmod>2018-06-04</lastmod>
</url>
</urlset>

Puedes encontrar ejemplos más elaborados y documentación completa en sitemaps.org.

Consulta ejemplos de sitemaps en los que se indican páginas en idiomas alternativos y sitemaps de noticias, imágenes o archivos de vídeo.

RSS, mRSS y Atom 1.0

Si tienes un blog con un feed RSS o Atom, puedes enviar la URL del feed como sitemap. La mayoría de los programas para gestionar blogs crean feeds de forma automática, pero es importante saber que estos feeds solo proporcionan información sobre URLs recientes.

  • Google admite feeds RSS 2.0 y Atom 1.0.
  • Para dar a Google detalles sobre el contenido de vídeo de tu sitio, puedes utilizar un feed mRSS (RSS multimedia).

Texto

Si tu sitemap incluye solo URLs de páginas web, puedes proporcionar a Google un archivo de texto simple que contenga una URL por línea. Por ejemplo:

http://www.example.com/file1.html
http://www.example.com/file2.html
        

Directrices sobre sitemaps de texto sin formato:

  • Guarda tu archivo con la codificación UTF‑8.
  • No incluyas nada que no sea una URL en el archivo de sitemap.
  • Puedes asignar el nombre que quieras al archivo, siempre que tenga una extensión .txt (por ejemplo, sitemap.txt).

Extensiones de sitemaps para indicar otros tipos de contenido

Google admite sintaxis de sitemaps adicionales para informar de los tipos de contenido que se indican a continuación. Describe con ellas archivos de vídeo, imágenes y otros contenidos difíciles de analizar que haya en tu sitio para mejorar su indexación.

Directrices generales sobre sitemaps

  • Incluye URLs completas y utiliza siempre la misma estructura. Google rastrea las URLs tal y como se muestran. Por ejemplo, si tu sitio está en https://www.example.com/, no indiques https://example.com/ (falta www) ni ./mypage.html (URL relativa).
  • Puedes publicar un sitemap en cualquier directorio de tu sitio, pero ten en cuenta que solo afectará a los directorios secundarios. Por este motivo, recomendamos que los sitemaps se publiquen en la raíz de los sitios, porque de este modo pueden afectar a todos los archivos.
  • No incluyas identificadores de sesión de las URLs en tu sitemap. De este modo, evitas que esas URLs se rastreen más de una vez.
  • Informa a Google sobre las versiones de URLs en otros idiomas mediante anotaciones hreflang.
  • Los archivos de sitemap deben seguir la codificación UTF‑8 y las URLs deben contener los caracteres de escape adecuados.
  • Divide los sitemaps grandes en sitemaps más pequeños. Un sitemap puede contener hasta 50.000  URLs y no debe superar los 50 MB sin comprimir. Si tienes que dividir tu sitemap, no envíes sitemaps sueltos; incluye las diferentes partes en un archivo de índice de sitemaps.
  • Incluye solo URLs canónicas en tus sitemaps. Si tienes dos versiones de una página, incluye en el sitemap solo la que prefieres que se muestre en los resultados de búsqueda. En el caso de que tengas dos versiones de tu sitio (por ejemplo, una versión con "www" y otra sin), elige la que prefieras, incluye el sitemap en su raíz y añade rel=canonical o redirecciones en la otra versión.
  • Si las versiones para móviles y para ordenadores de tus páginas tienen URLs distintas, te recomendamos que solo incluyas una versión en tu sitemap. No obstante, si quieres incluir ambas, anótalas de manera que se indique de qué versión son.
  • Incluye otros tipos de contenido, como vídeos, imágenes y noticias, mediante extensiones de sitemaps.
  • Si tienes páginas diferentes en función del idioma o de la región, puedes indicar las URLs alternativas con un atributo hreflang en un sitemap o con etiquetas HTML.
  • Caracteres no alfanuméricos y no latinos. Es obligatorio que los archivos de sitemap estén codificados con UTF‑8 (puedes hacerlo al guardarlos). Como en todos los archivos XML, en los valores de datos (incluidas las URLs) no pueden usarse los caracteres que se indican en la tabla que hay más abajo. En los sitemaps solo puede haber caracteres ASCII; no pueden incluirse caracteres de ASCII extendido, determinados códigos de control ni caracteres especiales, como * o {}. Si la URL de tu sitemap contiene alguno de estos caracteres, recibirás un mensaje de error al añadirla.
    Carácter Código con caracteres de escape
    Signo et & &amp;
    Comillas simples ' &apos;
    Comillas " &quot;
    Mayor que > &gt;
    Menor que < &lt;
    Además, todas las URLs, incluida la de tu sitemap, deben estar codificadas para que las pueda leer el servidor web en el que estén alojadas. No obstante, salvo que las escribas manualmente, cualquier herramienta que uses las codificará. Si envías tu sitemap y recibes un error en el que se indica que Google no puede encontrar algunas de tus URLs, comprueba que estas cumplan el estándar RFC-3986 de URIs, el estándar RFC-3987 de IRIs y el estándar XML.

    A continuación se muestra un ejemplo de una URL que utiliza un carácter que no es ASCII (ü) y otro que necesita caracteres de escape de entidad (&):
    http://www.example.com/ümlat.html&q=name
    Esta es la misma URL, pero con codificación ISO‑8859‑1 (para alojarla en un servidor que utiliza esa codificación) y con caracteres de escape:
    http://www.example.com/%FCmlat.html&q=name
    Esta es la misma URL, pero con codificación UTF‑8 (para alojarla en un servidor que utiliza esa codificación) y con caracteres de escape:
    http://www.example.com/%C3%BCmlat.html&q=name
    Esta es la misma URL, pero con caracteres de escape de entidad:
    http://www.example.com/%C3%BCmlat.html&amp;q=name
  • Recuerda que los sitemaps son sugerencias que haces a Google sobre las páginas que consideras importantes. Google no se compromete a rastrear todas las URLs que incluyas en el tuyo.
  • Google ignora los valores <priority> y <changefreq>.
  • Google usa el valor <lastmod> si es coherente y verificable (por ejemplo, si se compara con la última modificación de la página).
  • La posición que tienen tus URLs en un sitemap no importa, ya que Google no las rastrea en el orden en que aparecen.

Poner sitemaps a disposición de Google

Google no comprueba los sitemaps siempre que rastrea los sitios web; solo lo hace la primera vez que los detecta. Luego, solo los volverá a rastrear cuando se utilice la función "ping" para avisar a Google de que se han modificado. Avisa a Google solo cuando subas un sitemap nuevo o modifiques uno que ya tengas; no envíes varias veces un sitemap que no hayas editado, ni tampoco utilices la función "ping" en este caso.

Hay varias maneras de hacer que un sitemap esté a disposición de Google:

  • Envíalo a Google mediante el informe de Sitemaps de Search Console
  • Inserta la siguiente línea en cualquier parte de tu archivo robots.txt para indicar la ruta de tu sitemap:
    Sitemap: http://example.com/sitemap_location.xml
  • Solicita que Google rastree tu sitemap mediante el servicio "ping". Envía una solicitud HTTP GET de la siguiente manera:
    http://www.google.com/ping?sitemap=<complete_url_of_sitemap>
    por ejemplo:
    http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

Solucionar problemas de sitemaps

Consulta la guía para solucionar problemas de sitemaps.