Crear y enviar un sitemap
En este artículo se explica cómo crear sitemaps y ponerlos a disposición de Google. Más información sobre los sitemaps
- Decide el formato de sitemap que quieres utilizar.
- Crea el sitemap, ya sea de forma automática o manual.
- Pon el sitemap a disposición de Google añadiéndolo a tu archivo robots.txt o enviándolo directamente a Search Console.
Formatos de sitemaps
Google admite diferentes formatos de sitemaps:
Google espera que todos los formatos sigan el protocolo de sitemap estándar. Por el momento, Google no utiliza el atributo <priority>
en los sitemaps.
Sea cual sea el formato que se use, los sitemaps no pueden tener un tamaño superior a 50 MB sin comprimir ni incluir más de 50.000 URLs. Si tienes un archivo más grande o con más URLs, tienes que dividirlo en varios sitemaps. En ese caso, puedes crear un índice de sitemap (un archivo que lleva a una lista de sitemaps) y enviar solo ese archivo a Google. Puedes enviar varios sitemaps o archivos de índices de sitemaps a Google.
XML
A continuación se muestra un sitemap XML muy básico que incluye la ubicación de una sola URL:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.example.com/foo.html</loc> <lastmod>2018-06-04</lastmod> </url> </urlset>
Puedes encontrar ejemplos más elaborados y documentación completa en sitemaps.org.
Consulta ejemplos de sitemaps en los que se indican páginas en idiomas alternativos y sitemaps de noticias, imágenes o archivos de vídeo.
RSS, MRSS y Atom 1.0
Si tienes un blog con un feed RSS o Atom, puedes enviar la URL del feed como sitemap. La mayoría de los programas para gestionar blogs crean feeds de forma automática, pero es importante saber que estos feeds solo proporcionan información sobre URLs recientes.
- Google admite feeds RSS 2.0 y Atom 1.0.
- Para dar a Google detalles sobre el contenido de vídeo de tu sitio, puedes utilizar un feed MRSS (RSS multimedia).
Texto
Si tu sitemap incluye solo URLs de páginas web, puedes proporcionar a Google un archivo de texto simple que contenga una URL por línea. Por ejemplo:
http://www.example.com/file1.html http://www.example.com/file2.html
Directrices sobre sitemaps de texto sin formato
- Guarda tu archivo con la codificación UTF‑8.
- No incluyas nada que no sea una URL en los archivos de sitemap.
- Puedes dar al archivo el nombre que quieras, siempre y cuando tenga una extensión
.txt
(por ejemplo, sitemap.txt).
Extensiones de sitemaps para indicar otros tipos de contenido
Google admite sintaxis de sitemaps adicionales de los siguientes tipos de contenido. Describe con ellas archivos de vídeo, imágenes y otros contenidos difíciles de analizar que haya en tu sitio para mejorar su indexación.
Directrices generales sobre sitemaps
-
Incluye URLs completas y utiliza siempre la misma estructura. Google rastrea las URLs tal y como se muestran.
Por ejemplo, si tu sitio está en
https://www.example.com/
, no indiqueshttps://example.com/
(faltawww
) ni./mypage.html
(URL relativa). - Puedes publicar un sitemap en cualquier directorio de tu sitio, pero ten en cuenta que solo afectará a los directorios secundarios. Por este motivo, recomendamos que los sitemaps se publiquen en la raíz de los sitios, porque de este modo pueden afectar a todos los archivos.
- No incluyas identificadores de sesión de las URLs en tu sitemap. De este modo, evitas que esas URLs se rastreen más de una vez.
- Informa a Google sobre las versiones de URLs en otros idiomas mediante anotaciones hreflang.
- Los archivos de sitemap deben seguir la codificación UTF‑8 y las URLs deben contener los caracteres de escape adecuados.
- Divide los sitemaps grandes en sitemaps más pequeños. Un sitemap puede contener hasta 50.000 URLs y no debe superar los 50 MB sin comprimir. Si tienes que dividir tu sitemap, no envíes sitemaps sueltos; incluye las diferentes partes en un archivo de índice de sitemaps.
-
Incluye solo
URLs canónicas
en tus sitemaps. Si tienes dos versiones de una página, incluye en el sitemap solo la que
prefieres que se muestre en los resultados de búsqueda. En el caso de que tengas dos versiones de tu sitio (por ejemplo, una versión con "www"
y otra sin), elige la que prefieras, incluye el sitemap en su raíz y añade
rel=canonical
o redirecciones en la otra versión. - Si las versiones para móviles y para ordenadores de tus páginas tienen URLs distintas, te recomendamos que solo incluyas una versión en tu sitemap. No obstante, si quieres incluir ambas, anótalas de manera que se indique de qué versión son.
- Incluye otros tipos de contenido, como vídeos, imágenes y noticias, mediante extensiones de sitemaps.
- Si tienes páginas diferentes en función del idioma o de la región, puedes indicar las URLs alternativas con un atributo hreflang en un sitemap o con etiquetas HTML.
-
Caracteres no alfanuméricos y no latinos.
Es obligatorio que los archivos de sitemap estén codificados con UTF‑8 (puedes hacerlo al guardarlos). Como en todos los archivos XML, en los valores de datos (incluidas las URLs) se deben utilizar códigos de escape de entidad para los caracteres que se indican en la tabla que hay a continuación. En los sitemaps solo puede haber caracteres ASCII; no pueden incluirse caracteres de ASCII extendido, determinados códigos de control ni caracteres especiales, como
*
o{}
. Si la URL de tu sitemap contiene alguno de estos caracteres, recibirás un mensaje de error al añadirla.Carácter Símbolo Código con caracteres de escape Signo et &
&
Comillas simples '
'
Comillas "
"
Mayor que >
>
Menor que <
<
Además, todas las URLs, incluida la de tu sitemap, deben tener caracteres de escape y estar codificadas para que las pueda leer el servidor web en el que estén alojadas. No obstante, salvo que las escribas manualmente, cualquier herramienta que uses las codificará. Si envías tu sitemap y recibes un error en el que se indica que Google no puede encontrar algunas de tus URLs, comprueba que estas cumplan el estándar RFC‑3986 de URIs, el estándar RFC‑3987 de IRIs y el estándar XML.
A continuación se muestra una URL de ejemplo que tiene un carácter que no es ASCII (
ü
) y otro que necesita caracteres de escape de entidad (&
):http://www.example.com/ümlat.html&q=name
Esta es la misma URL con codificación ISO-8859 y con caracteres de escape en la entidad:
http://www.example.com/%FCmlat.html&q=name
A continuación se muestra la misma URL con codificación UTF-8 y con caracteres de escape en la entidad:
http://www.example.com/%C3%BCmlat.html&q=name
- Recuerda que los sitemaps son sugerencias que haces a Google sobre las páginas que consideras importantes. Google no se compromete a rastrear todas las URLs que incluyas en el tuyo.
-
Google ignora los valores
<priority>
y<changefreq>
. -
Google usa el valor
<lastmod>
si se utiliza de manera coherente y verificable (por ejemplo, si se compara con la última modificación de la página). - La posición que tienen tus URLs en un sitemap no importa, ya que Google no las rastrea en el orden en que aparecen.
Crear un sitemap
Al crear un sitemap, indicas a los buscadores las URLs que prefieres que se muestren en los resultados de búsqueda. Estas son las URLs canónicas. Si tienes el mismo contenido accesible desde URLs diferentes, elige la URL que prefieres e incluye solo esa en el sitemap y no todas las URLs que llevan al mismo contenido.
Una vez que hayas decidido qué URLs quieres incluir en el sitemap, elige uno de los siguientes métodos para crear un sitemap, en función de la arquitectura y el tamaño de tu sitio:
- Deja que tu CMS genere un sitemap automáticamente.
- Si en un sitemap solo se van a incluir unas pocas decenas de URLs, puedes crearlo manualmente.
- En el caso de que el sitemap vaya a tener más que unas pocas decenas de URLs, genéralo automáticamente.
Dejar que tu CMS genere un sitemap automáticamente
Si utilizas un sistema de gestión de contenido (CMS), como WordPress, Wix o Blogger, es probable que ya haya puesto un sitemap a disposición de los buscadores. Busca información sobre cómo genera tu CMS los sitemaps o cómo crear un sitemap si tu CMS no lo genera automáticamente. Por ejemplo, en el caso de Wix, busca "wix sitemap".
En el caso de cualquier otra configuración de sitios, tendrás que generar el sitemap por tu cuenta.
Crear un sitemap manualmente
En el caso de los sitemaps con pocas decenas de URLs, es posible que puedas crear uno manualmente. Abre un editor de texto como Bloc de notas de Windows o Nano (Linux y MacOS) y sigue la sintaxis descrita en la sección Formatos de sitemaps. Puedes dar al archivo el nombre que quieras, siempre y cuando los caracteres estén permitidos en una URL.
Puedes crear sitemaps más grandes manualmente, pero es un proceso tedioso.
Generar un sitemap automáticamente
En el caso de los sitemaps que tengan más que unas pocas decenas de URLs, deberás generar el sitemap. Hay varias herramientas que pueden generar un sitemap. Sin embargo, la mejor forma de hacerlo es que el software de tu sitio web lo haga automáticamente. Por ejemplo, puedes extraer las URLs de la base de datos de tu sitio web y exportarlas a un borrador o al archivo de tu servidor web. Habla con tus desarrolladores o con tu gestor de servidores sobre esta solución. Si necesitas inspiración para crear el código, consulta nuestra antigua colección de generadores de sitemaps de terceros.
Ten en cuenta que los sitemaps no pueden superar los 50 MB. Más información sobre cómo gestionar sitemaps grandes
Enviar un sitemap a Google
Google no comprueba los sitemaps siempre que rastrea un sitio web; solo lo hace la primera vez que los detecta. Luego, solo los volverá a rastrear cuando le hagas ping a Google para avisar de que se han modificado. Avisa a Google solo cuando subas un sitemap nuevo o modifiques uno que ya tengas. No envíes varias veces un sitemap que no hayas modificado, ni tampoco le hagas ping en este caso.
Si has actualizado algunas páginas del sitemap, márcalas con el campo <lastmod>
.
En otros archivos XML hay un campo similar, como el campo <updated>
en Atom XML.
Consulta también cómo calcular esta fecha.
Hay varias maneras de poner un sitemap a disposición de Google:
- En Search Console, envía un sitemap con el informe "Sitemaps".
-
Con la herramienta de hacer pings. Desde tu navegador o desde la línea de comandos, envía a la dirección que figura a continuación una solicitud GET en la que se indique la URL completa de tu sitemap. Recuerda que el archivo de sitemap debe ser accesible:
https://www.google.com/ping?sitemap=FULL_URL_OF_SITEMAP
Ejemplo:
https://www.google.com/ping?sitemap=https://example.com/sitemap.xml
-
Insertando en cualquier parte del archivo robots.txt la línea que hay a continuación, pero con la ruta de tu sitemap. De este modo, encontraremos el sitemap la próxima vez que rastreemos tu archivo robots.txt:
Sitemap: https://example.com/my_sitemap.xml
- Utiliza WebSub si usas Atom/RSS en tu sitemap y quieres avisar de los cambios no solo a Google, sino también a otros buscadores.
Enviar un sitemap es tan solo una recomendación: no garantiza que Google lo descargue ni que lo utilice para rastrear URLs del sitio.
Solucionar problemas de sitemaps
Consulta la guía para solucionar problemas de sitemaps.