Como o Google gera títulos para documentos com desalinhamento de idioma ou script

Sexta-feira, 3 de junho de 2022

Esta semana, apresentamos uma melhoria algorítmica que identifica documentos em que o elemento de título está escrito em um idioma ou script diferente e escolhe um título semelhante ao conteúdo do documento. Isso se baseia no princípio geral de que o título de um documento precisa estar no idioma ou script do conteúdo principal. É por isso que podemos ir além dos elementos de título para os resultados da Web.

Títulos multilíngues

Títulos multilíngues repetem a mesma frase com dois idiomas ou scripts diferentes. O padrão mais popular é anexar uma versão em inglês ao texto do título original.

गीतांजलि की जीवनी - Biografia de Geetanjali em hindi

Neste exemplo, o título consiste em duas partes (divididas por um hífen), e elas expressam o mesmo conteúdo em diferentes idiomas, hindi e português. Embora o título esteja nos dois idiomas, o documento em si está apenas em hindi. Nosso sistema detecta essa inconsistência e talvez use somente o título em hindi, como o seguinte:

गीतांजलि की जीवनी

Títulos com alfabeto latino

A transliteração ocorre quando o conteúdo é escrito de um idioma para outro que usa um script ou alfabeto diferente. Por exemplo, considere o título de uma página com uma música escrita em hindi, mas transliterada para caracteres latinos em vez do script nativo devanágari de hindi:

jis desh me holi kheli jati hai

Nosso sistema tenta encontrar um título alternativo usando o script predominante na página, que, nesse caso, pode ser este:

जिस देश में होली खेली जाती है

Resumo

Em geral, nossos sistemas tendem a usar o elemento do título da página. Em casos de títulos transliterados ou multilíngues, nossos sistemas podem buscar alternativas que correspondam ao idioma predominante da página. Por isso, é recomendável fornecer um título que corresponda ao idioma e/ou ao script do conteúdo principal da página.

Envie mais feedback no nosso fórum, incluindo nas conversas sobre o tópico em inglês e japonês.