Trabajar con sitios web multilingües

Viernes, 19 de marzo del 2010

Un sitio web multilingüe es el que ofrece contenido en más de un idioma. Entre los ejemplos de sitios web multilingües se incluyen el sitio de una empresa canadiense con una versión en inglés y con otra en francés o un blog sobre el fútbol en Latinoamérica disponible en español y en portugués.

Por lo general, es interesante tener un sitio web multilingüe si tu audiencia objetivo está formada por personas que hablan distintos idiomas. Si tu blog sobre fútbol latinoamericano está dirigido a la audiencia brasileña, puedes publicarlo solo en portugués. Pero si también quisieras llegar a aficionados al fútbol de Argentina, sería útil ofrecer contenido en español.

Google y el reconocimiento de idioma

Google intenta determinar los idiomas principales de cada una de tus páginas. Puedes ayudarnos a que el reconocimiento de idiomas sea más sencillo si te limitas a un idioma por página y evitas usar traducciones en paralelo. Aunque Google puede reconocer si una página tiene más de un idioma, recomendamos que utilices el mismo en todos los elementos de una página, como títulos, barras laterales, menús, etc.

Ten en cuenta que Google ignora toda la información a nivel de código, desde los atributos "lang" hasta las definiciones de tipo de documento (DTD). Algunos programas de edición web crean estos atributos automáticamente, por lo que no son muy fiables a la hora de determinar el idioma de una página web.

Un usuario que acude a Google y hace una búsqueda en su idioma espera encontrar resultados de búsqueda localizados. Y aquí es donde tú, como webmaster, entras en escena: si vas a localizar tu contenido, haz que sea visible en los resultados de búsqueda con algunos de los consejos que te damos a continuación.

Estructura de un sitio multilingüe: estructura de URL

No hace falta crear URLs especiales al desarrollar un sitio web multilingüe. Sin embargo, puede que los usuarios quieran identificar en qué sección del sitio web se encuentran solo con mirar la URL. Por ejemplo, las siguientes URLs indican a los usuarios que se encuentran en la sección en inglés de este sitio: https://example.ca/en/mountain-bikes.html o https://en.example.ca/mountain-bikes.html. Mientras que estas otras URLs indican a los usuarios que están viendo la misma página en francés: https://example.ca/fr/mountain-bikes.html o https://fr.example.ca/mountain-bikes.html. Además, con esta estructura de URL te será más fácil analizar la indexación de tu contenido multilingüe.

Si quieres crear URLs con caracteres que no sean ingleses, utiliza la codificación UTF-8. Las URLs codificadas en UTF-8 deben tener el formato de escape adecuado cuando se enlazan desde tu contenido. Si necesitas aplicar el formato de escape a las URLs de forma manual, puedes encontrar fácilmente un codificador de URLs online que se encargará de hacerlo. Por ejemplo, si quisieras traducir la URL https://example.ca/fr/mountain-bikes.html del inglés al francés, podrías obtener un resultado como este: https://example.ca/fr/vélo-de-montagne.html. Como esta URL contiene un carácter que no es inglés (é), al aplicarle el formato de escape adecuado para utilizarla en un enlace desde tus páginas, tendría este aspecto: https://example.ca/fr/v%C3%A9lo-de-montagne.html.

Rastrear e indexar tu sitio web multilingüe

Te recomendamos que no permitas que se indexen las traducciones automáticas, ya que no siempre tienen sentido y se podrían considerar spam. Y lo que es más importante: el objetivo de un sitio web multilingüe es llegar a una audiencia más amplia proporcionando contenido valioso en varios idiomas. Si los usuarios no entienden una traducción automática, o si les parece artificial, deberías plantearte si realmente quieres presentarles este tipo de contenido.

Si vas a localizar tu sitio, procura que el robot de Google pueda rastrear todas las versiones de idioma del sitio con facilidad. Te recomendamos el intercambio de enlaces página por página. Es decir, incluir enlaces entre las páginas que tienen el mismo contenido en distintos idiomas, lo que también puede ser muy útil para tus usuarios. Siguiendo con el ejemplo anterior, supongamos que un hablante de francés llega a la página https://example.ca/en/mountain-bikes.html; ahora, con un solo clic, puede acceder a https://example.ca/fr/vélo-de-montagne.html, donde verá el mismo contenido en francés.

Para que todo el contenido de tu sitio sea más rastreable, evita las redirecciones automáticas en función del idioma percibido del usuario. Estas redirecciones pueden impedir que los usuarios (y los buscadores) vean todas las versiones de tu sitio.

Por último, mantén el contenido de cada idioma en URLs independientes. No uses cookies para mostrar las versiones traducidas.

Trabajar con codificaciones de caracteres

Google extrae directamente las codificaciones de caracteres de los encabezados HTTP, de los encabezados de página HTML y del contenido. No es necesario que hagas nada más al respecto, aparte de evitar que haya información contradictoria; por ejemplo, entre el contenido y los encabezados. Aunque Google puede reconocer distintas codificaciones de caracteres, te recomendamos que uses UTF-8 en tu sitio web siempre que sea posible.

Si se te traba la lengua...

Ahora que ya sabes todo esto, tu sitio web no tendrá problemas por ser multilingüe, aunque a ti se te trabe la lengua al hablar muchos idiomas.

Para obtener más información, consulta nuestra entrada sobre sitios multirregionales y no te pierdas la próxima entrada, en la que profundizaremos en situaciones especiales que pueden surgir al trabajar con sitios web internacionales. Hasta entonces, no dudes en pasarte por el foro de ayuda y unirte al debate.