Cara Google membuat judul untuk dokumen dengan ketidakselarasan bahasa atau skrip

Jumat, 3 Juni 2022

Minggu ini, kami memperkenalkan peningkatan algoritme yang mengidentifikasi dokumen yang elemen judulnya ditulis dalam bahasa atau skrip yang berbeda dari kontennya, dan memilih judul yang mirip dengan bahasa dan skrip dokumen tersebut. Hal ini berdasarkan prinsip umum bahwa judul dokumen harus ditulis dalam bahasa atau skrip konten utamanya. Itulah salah satu alasan kami mungkin tidak hanya berfokus pada elemen judul untuk menentukan judul hasil web.

Judul multibahasa

Judul multibahasa mengulangi frasa yang sama dalam dua bahasa atau skrip yang berbeda. Pola yang paling populer adalah menambahkan versi bahasa Inggris ke teks judul aslinya.

गीतांजलि की जीवनी - Biografi Geetanjali dalam bahasa Hindi

Dalam contoh ini, judul terdiri dari dua bagian (dibagi dengan tanda hubung), dan judul tersebut menampilkan konten yang sama dalam bahasa yang berbeda (Hindi dan Inggris). Meskipun judul tersedia dalam kedua bahasa, dokumen itu sendiri hanya ditulis dalam bahasa Hindi. Sistem kami mendeteksi inkonsistensi tersebut dan mungkin hanya menggunakan teks judul berbahasa Hindi, seperti:

गीतांजलि की जीवनी

Judul dengan skrip Latin

Transliterasi adalah tindakan menulis konten dari satu bahasa ke bahasa lain menggunakan skrip atau alfabet yang berbeda. Misalnya, pertimbangkan judul halaman untuk lagu yang ditulis dalam bahasa Hindi, tetapi ditransliterasi agar menggunakan karakter Latin, bukan skrip Devanagari asli Hindi:

jis desh me holi kheli jati hai

Dalam kasus seperti ini, sistem kami mencoba menemukan judul alternatif menggunakan skrip yang banyak digunakan di halaman, dan dalam hal ini dapat berupa:

जिस देश में होली खेली जाती है

Ringkasan

Secara umum, sistem kami cenderung menggunakan elemen judul halaman. Jika judul ditransliterasi atau dalam multibahasa, sistem kami mungkin mencari alternatif yang cocok dengan bahasa utama halaman. Oleh karena itu, sebaiknya beri judul yang cocok dengan bahasa dan/atau skrip konten utama halaman.

Kami menerima masukan lebih lanjut di forum kami, termasuk di rangkaian pesan yang sudah ada tentang topik ini dalam bahasa Inggris dan Jepang.