Comment Google génère-t-il les titres pour les documents dont les langues ou les scripts ne correspondent pas ?

Vendredi 3 juin 2022

Cette semaine, nous avons lancé une amélioration basée sur un algorithme qui identifie les documents dont l'élément de titre est écrit dans une langue ou un script différent de son contenu, et qui choisit un titre semblable à la langue et au script de ces documents. Cette approche repose sur le principe général selon lequel le titre d'un document doit être rédigé en fonction de la langue ou du script de son contenu principal. C'est l'une des raisons pour lesquelles les titres des résultats Web peuvent aller au-delà des éléments de titre classiques.

Titres multilingues

Les titres multilingues répètent la même expression avec deux langues ou scripts différents. La méthode la plus populaire consiste à ajouter une version anglaise au texte du titre d'origine.

गीतांजलि की जीवनी - Geetanjali Biography in Hindi

Dans cet exemple, le titre se compose de deux parties (séparées par un trait d'union), qui expriment le même contenu dans différentes langues (hindi et anglais). Bien que le titre soit rédigé dans les deux langues, le document lui-même est écrit en hindi uniquement. Notre système détecte ce type d'incohérence et peut n'utiliser que le texte du titre en hindi, par exemple :

गीतांजलि की जीवनी

Titres en latin

La translittération est utilisée lorsque le contenu d'une langue est traduit dans une autre langue qui utilise un script ou un alphabet différent. Prenons l'exemple d'un titre de page pour une chanson écrite en hindi, mais transcrite pour utiliser des caractères latins au lieu de l'écriture native dévanâgarienne en hindi :

jis desh me holi kheli jati hai

Dans ce cas, notre système essaie d'identifier un autre titre en utilisant le script qui prévaut sur la page. Par exemple :

जिस देश में होली खेली जाती है

Résumé

En général, nos systèmes utilisent l'élément de titre de la page. En cas de titres multilingues ou translittérés, nos systèmes peuvent rechercher des variantes correspondant à la langue principale de la page. C'est pourquoi nous vous recommandons de fournir un titre correspondant à la langue et/ou au script du contenu principal de la page.

N'hésitez pas à nous envoyer d'autres commentaires sur notre forum, y compris via les fils de discussion existants sur le sujet en anglais et en japonais.