Crear y enviar sitemaps

En este artículo se explica cómo crear sitemaps y ponerlos a disposición de Google. Más información sobre los sitemaps

  1. Elige qué páginas de tu sitio quieres que Google rastree y determina la versión canónica de cada una.
  2. Decide el formato de sitemap que quieres utilizar y si vas a crear tu sitemap manualmente o con alguna herramienta de terceros.
  3. Pon el sitemap a disposición de Google añadiéndolo a tu archivo robots.txt o enviándolo directamente a Search Console.

Formatos de sitemaps

Google admite diferentes formatos de sitemaps, que se describen en este apartado, aunque todos deben seguir el protocolo de sitemap estándar. Por el momento, Google no utiliza el atributo <priority> en los sitemaps.

Sea cual sea el formato que se use, los sitemaps no pueden tener un tamaño superior a 50 MB sin comprimir ni incluir más de 50.000 URL. Si tienes un archivo más grande o con más URL, tienes que dividirlo en varios sitemaps. En ese caso, puedes crear un índice de sitemaps (un archivo que lleva a una lista de sitemaps) y enviar solo ese archivo a Google. Puedes enviar varios sitemaps o archivos de índices de sitemaps a Google.

XML

A continuación se muestra un sitemap XML muy básico que incluye la ubicación de una sola URL:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.example.com/foo.html</loc>
   <lastmod>2018-06-04</lastmod>
  </url>
</urlset>

Puedes encontrar ejemplos más elaborados y documentación completa en sitemaps.org.

Consulta ejemplos de sitemaps en los que se indican páginas en idiomas alternativos y sitemaps de noticias, imágenes o archivos de vídeo.

RSS, MRSS y Atom 1.0

Si tienes un blog con un feed RSS o Atom, puedes enviar la URL del feed como sitemap. La mayoría de los programas para gestionar blogs crean feeds de forma automática, pero es importante saber que estos feeds solo proporcionan información sobre URL recientes.

  • Google admite feeds RSS 2.0 y Atom 1.0.
  • Para dar a Google detalles sobre el contenido de vídeo de tu sitio, puedes utilizar un feed mRSS (RSS multimedia).

Texto

Si tu sitemap incluye solo URLs de páginas web, puedes proporcionar a Google un archivo de texto simple que contenga una URL por línea. Por ejemplo:

http://www.example.com/file1.html
http://www.example.com/file2.html

Directrices sobre sitemaps de texto sin formato:

  • Guarda tu archivo con la codificación UTF‑8.
  • El archivo de texto solo puede contener la lista de URLs.
  • Puedes asignar el nombre que quieras al archivo, siempre que tenga una extensión .txt (por ejemplo, sitemap.txt).

Google Sites

Si has creado y verificado un sitio con Google Sites, este servicio generará un sitemap automáticamente. Este sitemap no se puede modificar, pero puedes enviarlo a Google si quieres leer los datos del informe de sitemaps. Si tienes más de 1000 páginas en un mismo subdirectorio, es posible que tu sitemap no se muestre correctamente.

  • Si tu sitio está alojado en Google Sites, la URL del sitemap es http://sites.google.com/site/yoursitename/system/feeds/sitemap.
  • Si has creado el sitio con Google Workspace, la URL del sitemap es https://sites.google.com/yourdomain/yoursitename/system/feeds/sitemap.

Extensiones de sitemaps para indicar otros tipos de contenido

Google admite sintaxis de sitemaps adicionales para informar de los tipos de contenido que se indican a continuación. Describe con ellas archivos de vídeo, imágenes y otros contenidos difíciles de analizar que haya en tu sitio para mejorar su indexación.

Directrices generales sobre sitemaps

  • Incluye URL completas y utiliza siempre la misma estructura. Google rastrea las URL tal y como se muestran. Por ejemplo, si tu sitio está en https://www.example.com/, no indiques https://example.com/ (falta www) ni ./mypage.html (URL relativa).
  • Puedes publicar un sitemap en cualquier directorio de tu sitio, pero ten en cuenta que solo afectará a los directorios secundarios. Por este motivo, recomendamos que los sitemaps se publiquen en la raíz de los sitios, porque de este modo pueden afectar a todos los archivos.
  • No incluyas identificadores de sesión de las URL en tu sitemap. De este modo, evitas que esas URL se rastreen más de una vez.
  • Informa a Google sobre las versiones de URLs en otros idiomas mediante anotaciones hreflang.
  • Los archivos de sitemap deben seguir la codificación UTF‑8 y las URL deben contener los caracteres de escape adecuados.
  • Divide los sitemaps grandes en sitemaps más pequeños. El tamaño máximo de un sitemap es de 50.000 URLs o 50 MB sin comprimir. Si tienes que dividir tu sitemap, no envíes sitemaps sueltos; incluye las diferentes partes en un archivo de índice de sitemaps.
  • Incluye solo URL canónicas en tus sitemaps. Si tienes dos versiones de una página, añade al sitemap únicamente la canónica que haya seleccionado Google. En el caso de que tengas dos versiones de tu sitio (por ejemplo, una versión con "www" y otra sin), elige la que prefieras, incluye el sitemap en su raíz y añade "rel=canonical" o redirecciones en la otra versión.
  • Si las versiones para móviles y para ordenadores de tus páginas tienen URL distintas, te recomendamos que solo incluyas una versión en tu sitemap. No obstante, si quieres incluir ambas, anótalas de manera que se indique de qué versión son.
  • Indica otros tipos de contenido, como vídeos, imágenes o noticias, mediante extensiones de sitemaps.
  • Si tienes páginas diferentes en función del idioma o de la región, puedes indicar las URL alternativas con un atributo hreflang en un sitemap o con etiquetas HTML.
  • Caracteres no alfanuméricos y no latinos. Es obligatorio que los archivos de sitemap estén codificados con UTF‑8 (puedes hacerlo al guardarlos). Como en todos los archivos XML, en los valores de datos (incluidas las URL) no pueden usarse los caracteres que se indican en la tabla que hay más abajo; si tienes que utilizar alguno de ellos, sustitúyelo por el código de escape de entidad adecuado. En los sitemaps solo puede haber caracteres ASCII; no pueden incluirse caracteres de ASCII extendido, determinados códigos de control ni caracteres especiales como * o {}. Si en una URL de tu sitemap aparece alguno de estos caracteres, se mostrará un mensaje de error cuando intentes añadirla.
    Carácter Código con caracteres de escape
    Signo et & &amp;
    Comillas simples ' &apos;
    Comillas " &quot;
    Mayor que > &gt;
    Menor que < &lt;
    Además, todas las URL, incluida la de tu sitemap, deben estar codificadas para que las pueda leer el servidor web en el que estén alojadas. No obstante, salvo que las escribas manualmente, cualquier herramienta que uses las codificará. Si envías tu sitemap y recibes un error en el que se indica que Google no puede encontrar algunas de tus URL, comprueba que estas cumplan el estándar RFC‑3986 de URIs, el estándar RFC‑3987 de IRIs y el estándar XML.

    A continuación se muestra un ejemplo de una URL que utiliza un carácter que no es ASCII (ü) y otro que necesita caracteres de escape de entidad (&):
    http://www.example.com/ümlat.html&q=name
    Esta es la misma URL, pero con codificación ISO‑8859‑1 (para alojarla en un servidor que utiliza esa codificación) y con caracteres de escape:
    http://www.example.com/%FCmlat.html&q=name
    Esta es la misma URL, pero con codificación UTF‑8 (para alojarla en un servidor que utiliza esa codificación) y con caracteres de escape:
    http://www.example.com/%C3%BCmlat.html&q=name
    Esta es la misma URL, pero con caracteres de escape de entidad:
    http://www.example.com/%C3%BCmlat.html&amp;q=name
  • Recuerda que los sitemaps son sugerencias que haces a Google sobre las páginas que consideras importantes. Google no se compromete a rastrear todas las URL que incluyas en el tuyo.
  • Google ignora los valores de <priority> y <changefreq>, por lo que no hace falta añadirlos.
  • Google lee el valor <lastmod>, pero dejará de hacerlo si lo falseas.
  • La posición que tienen tus URL en un sitemap no importa, ya que Google no las rastrea en el orden en que aparecen.

Poner sitemaps a disposición de Google

Google no comprueba los sitemaps siempre que rastrea los sitios web; solo lo hace la primera vez que los detecta. Luego, solo los volverá a rastrear cuando se utilice la función "ping" para avisar a Google de que se han modificado. Avisa a Google solo cuando subas un sitemap nuevo o modifiques uno que ya tengas; no envíes varias veces un sitemap que no hayas editado, ni tampoco utilices la función "ping" en este caso.

Hay varias maneras de hacer que un sitemap esté a disposición de Google:

  • Envíalo a Google mediante la herramienta Sitemaps de Search Console.
  • Inserta la siguiente línea en cualquier parte de tu archivo robots.txt para indicar la ruta de tu sitemap:
    Sitemap: http://example.com/sitemap_location.xml
  • Solicita que Google rastree tu sitemap mediante la función "ping". Envía una solicitud HTTP GET de la siguiente manera:
    http://www.google.com/ping?sitemap=<complete_url_of_sitemap>
    Por ejemplo:
    http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

Solucionar problemas de sitemaps

Consulta la guía para solucionar problemas de sitemaps.