處理多語言網站

2019 年 3 月 19 日,星期五

多語言網站是指所提供的內容含有兩種以上語言的網站。多語言網站的例子包括:加拿大公司的網站有英文及法文版本,或是有關拉丁美洲足球的網誌同時提供西班牙文和葡萄牙文版本。

一般來說,如果網站目標對象包含使用不同語言的使用者,您就可以考慮建立多語言網站。 如果您想讓巴西讀者瀏覽您所撰寫有關拉丁美洲足球的網誌,只需要選擇使用葡萄牙文來發布內容即可。但如果您也想讓阿根廷的足球迷瀏覽網誌內容,那麼使用西班牙文就能達到目的。

Google 和語言辨識

Google 會嘗試判斷每個網頁所使用的主要語言。如果每個網頁都只使用一種語言,同時避免在網頁上提供對照翻譯,就能幫助 Google 更輕易正確判斷網頁語言。雖然 Google 可以對使用一種以上語言的網頁進行識別,但建議您網頁的所有元素使用相同的語言,例如標頭、側欄、選單等。

請注意,Google 會忽略所有程式碼層級的語言資訊,包括從「lang」屬性到文件類型定義 (DTD)。有些網頁編輯程式會自動建立這些屬性,因此在判斷網頁的語言時並不十分可靠。

如果有人透過 Google 使用自己的語言進行搜尋並希望可以找到本地化的搜尋結果,這時候,網站管理員就可以發揮作用:如果您要將內容本地化,就可以參考以下部分提示,在搜尋結果中顯示本地化內容

多語言版本網站剖析:網址結構

建立多語言版本網站時,不需要建立特別網址。但是,使用者也許會查看網址來判斷他們是瀏覽您網站的哪個部分。舉例來說,下列網址能讓使用者知道自己瀏覽的是網站的英文頁面:https://example.ca/en/mountain-bikes.htmlhttps://en.example.ca/mountain-bikes.html。而下面的網址則可以讓使用者知道他們瀏覽的是相同的法文網頁:https://example.ca/fr/mountain-bikes.htmlhttps://fr.example.ca/mountain-bikes.html。此外,您還可以透過這個網址結構,更輕鬆地分析多語言內容的索引。

如要想要使用非英文字元建立網址,請務必使用 UTF-8 編碼。當使用者按一下內容中的連結時,採用 UTF-8 編碼的網址應該能夠正確逸出。如果需要手動逸出網址,可以使用線上網址編碼器來為您代勞。舉例來說,如果要將以下網址從英文翻譯成法文:https://example.ca/fr/mountain-bikes.html,轉換後可能會變成:https://example.ca/fr/vélo-de-montagne.html。因為這個網址包含一個非英文字元 (é),所以在網頁的連結正確逸出後,情況可能會是:https://example.ca/fr/v%C3%A9lo-de-montagne.html

檢索多語言版本網站並建立索引

建議您禁止系統將自動翻譯內容編入索引,這是因為自動翻譯內容有時沒意義,而且可能會被視為垃圾內容。更重要的是,建立多語言網站的關鍵在於以多種語言提供有價值的內容,藉此觸及更多目標對象。如果使用者無法理解自動翻譯的內容,或是覺得翻譯僵硬不自然,則應問問自己是否真的有必要為使用者提供這類內容。

如果您要進行本地化,則可讓 Googlebot 輕鬆檢索您網站的所有語言版本。建議您逐一為網頁建立交叉連結。換句話說,您可以在擁有相同內容的不同語言網頁之間建立連結。這對使用者而言也非常實用。接續先前的範例,假設說法語的使用者造訪 https://example.ca/en/mountain-bikes.html,這時他們只要按一下滑鼠,就可以前往 https://example.ca/fr/vélo-de-montagne.html 並看到法文內容。

如要讓網站的所有內容更易於檢索,請避免根據使用者所用的語言進行自動重新導向。這類重新導向動作可能會讓使用者 (以及搜尋引擎) 無法瀏覽您網站的所有版本。

再次提醒您,請將各個語言的內容存放在不同的網址中,不要使用 Cookie 來顯示網頁的翻譯版本。

處理字元編碼

Google 會直接從 HTTP 標頭、HTML 網頁標頭和內容擷取字元編碼。您不必處理字元編碼,只需留意是否發生資訊衝突的情況,例如內容與標頭之間的衝突。雖然 Google 可識別不同的字元編碼,但還是建議您盡可能在網站上使用 UTF-8 編碼。

如果您的舌頭打結...

當您要說很多種不同的語言時,舌頭可能會打結,但您的網站卻可以輕鬆切換為不同語言,因為現在您已經知道如何處理多語言網站了!

詳情請參閱我們的多地區版本網站文章,並持續關注下一篇文章,我們將探討在處理全球網站時可能發生的特殊情況。在此之前,歡迎造訪說明論壇並加入討論