Como trabalhar com sites multilíngues

Sexta-feira, 19 de março de 2010

Um site multilíngue é qualquer site que oferece conteúdo em mais de um idioma. Por exemplo, os sites multilíngues podem incluir uma empresa canadense com uma versão em inglês e uma versão em francês do site ou um blog sobre um jogador de futebol latino-americano disponível em espanhol e em português.

Normalmente, faz sentido ter um site multilíngue quando o público-alvo consiste em falantes de idiomas diferentes. Caso seu blog sobre futebol latino-americano tenha como objetivo alcançar o público brasileiro, você pode publicar o site somente em português. No entanto, se você também quiser alcançar torcedores da Argentina, oferecer conteúdo em espanhol pode ajudar.

Google e reconhecimento de idiomas

O Google tenta determinar os principais idiomas de cada página. Para facilitar o reconhecimento de idiomas, use somente um idioma por página e evite usar traduções lado a lado. Embora o Google reconheça uma página como tendo mais de um idioma, recomendamos usar o mesmo idioma em todos os elementos dela: cabeçalhos, barras laterais, menus etc.

Lembre-se de que o Google ignora todas as informações de idioma no nível do código, de atributos "lang" a definições de tipo de documento (DTD). Alguns programas de edição na Web criam esses atributos automaticamente. Portanto, eles não são muito confiáveis ao tentar determinar o idioma de uma página da Web.

Alguém que acessa o Google e faz uma pesquisa no idioma espera encontrar resultados localizados. É aqui que entra o webmaster: caso você ofereça localização, deixe isso visível nos resultados da pesquisa com algumas das dicas abaixo.

A anatomia de um site multilíngue: estrutura do URL

Não é necessário criar URLs especiais ao desenvolver um site multilíngue. No entanto, os usuários talvez queiram identificar em qual seção do site estão apenas ao olhar o URL. Por exemplo, os seguintes URLs informam aos usuários que eles estão na seção em inglês do site: https://example.ca/en/mountain-bikes.html ou https://en.example.ca/mountain-bikes.html. Esses outros URLs permitem que os usuários saibam que estão visualizando a mesma página em francês: https://example.ca/fr/mountain-bikes.html ou https://fr.example.ca/mountain-bikes.html. Além disso, essa estrutura de URL facilitará a análise da indexação do seu conteúdo multilíngue.

Para criar URLs com caracteres diferentes do inglês, use a codificação UTF-8. Os URLs codificados em UTF-8 precisam ter um escape correto quando forem vinculados ao seu conteúdo. Caso precise fazer o escape dos seus URLs manualmente, você pode encontrar um codificador de URL on-line que faça isso por você. Por exemplo, para traduzir o URL https://example.ca/fr/mountain-bikes.html do inglês para o francês, ele pode ficar assim: https://example.ca/fr/vélo-de-montagne.html. Como esse URL contém um caractere diferente do inglês (é), ele ficaria da seguinte forma com escape para uso em um link nas suas páginas: https://example.ca/fr/v%C3%A9lo-de-montagne.html.

Como rastrear e indexar seu site multilíngue

Recomendamos que você não permita a indexação de traduções automáticas. As traduções automáticas nem sempre fazem sentido e podem ser consideradas spam. Mais importante ainda, o objetivo de criar um site multilíngue é alcançar um público maior oferecendo conteúdo valioso em vários idiomas. Caso seus usuários não consigam entender uma tradução automática ou se ela parecer artificial para eles, se pergunte se você realmente quer apresentar esse tipo de conteúdo a eles.

Se você localizar o site, facilite o rastreamento pelo Googlebot de todas as versões em diferentes idiomas. Considere usar links cruzados página por página. Ou seja, é possível usar links entre páginas com o mesmo conteúdo em idiomas diferentes. Isso também pode ser muito útil para os usuários. Seguindo o exemplo anterior, imagine que um falante de francês tenha aberto https://example.ca/en/mountain-bikes.html. Com um clique, ele pode acessar https://example.ca/fr/vélo-de-montagne.html, que mostra o mesmo conteúdo em francês.

Para tornar todo o conteúdo do seu site mais rastreável, evite redirecionamentos automáticos com base no idioma do usuário. Esses redirecionamentos podem impedir que os usuários (e os mecanismos de pesquisa) visualizem todas as versões do site.

Por último, mas não menos importante, mantenha o conteúdo para cada idioma em URLs separados. Não use cookies para mostrar versões traduzidas.

Como trabalhar com codificações de caracteres

O Google extrai diretamente codificações de caracteres de cabeçalhos HTTP, cabeçalhos de páginas HTML e conteúdo. Não há muito o que fazer com a codificação de caracteres, a não ser verificar se há informações conflitantes. Por exemplo, entre conteúdo e cabeçalhos. O Google pode reconhecer diferentes codificações de caracteres, mas recomendamos que você use UTF-8 no seu site sempre que possível.

Para não confundir...

Agora que você sabe tudo isso, você pode até se confundir ao falar muitos idiomas, mas seu site não vai ter esse problema!

Para mais informações, leia nossa postagem sobre sites multirregionais e fique atento para a próxima postagem, em que nos aprofundaremos em situações especiais que podem surgir ao trabalhar com sites globais. Até lá, fique à vontade para visitar o Fórum de Ajuda e participar da discussão.