Praca z witrynami wielojęzycznymi

Piątek, 19 marca 2010 roku

Witryna wielojęzyczna to każda witryna, która zawiera treści w więcej niż 1 języku. Przykłady witryn wielojęzycznych mogą obejmować kanadyjską firmę z angielską i francuską wersją swojej witryny lub blog o południowoamerykańskiej piłce nożnej dostępny w językach hiszpańskim i portugalskim.

Zazwyczaj prowadzenie wielojęzycznej witryny ma sens, jeśli w grupie odbiorców znajdują się osoby, które mówią w różnych językach. Jeśli Twój blog o latynoamerykańskiej piłce nożnej ma dotrzeć do odbiorców brazylijskich, możesz publikować go tylko w języku portugalskim. Jeśli jednak chcesz dotrzeć też do fanów futbolu z Argentyny, warto będzie dodać treści w języku hiszpańskim.

Google i rozpoznawanie języka

Google próbuje określić główny język każdej z Twoich stron. Aby ułatwić rozpoznawanie języka, możesz ustawić tylko 1 język na każdej stronie i nie stosować równoległego tłumaczenia. Google może rozpoznać stronę zawierającą więcej niż 1 język, ale zalecamy użycie tego samego języka we wszystkich jej elementach: nagłówkach, paskach bocznych, menu itp.

Pamiętaj, że Google ignoruje wszystkie informacje o języku na poziomie kodu, od atrybutów „lang” po definicje typów dokumentów (DTD). Niektóre programy do edycji stron internetowych automatycznie tworzą te atrybuty, dlatego nie są zbyt wiarygodne przy określaniu języka strony.

Użytkownik, który szuka w Google informacji w swoim języku, chce znaleźć zlokalizowane wyniki wyszukiwania. Tu zaczyna się rola webmastera: jeśli zamierzasz lokalizować stronę, pamiętaj, aby była widoczna w wynikach wyszukiwania korzystając z poniższych wskazówek.

Anatomia witryny wielojęzycznej: struktura adresów URL

Podczas tworzenia witryny wielojęzycznej nie trzeba tworzyć specjalnych adresów URL. Mimo to użytkownicy mogą chcieć się dowiedzieć, którą sekcję Twojej witryny właśnie przeglądają, patrząc na adres URL. Na przykład te adresy URL informują użytkowników, że oglądają angielskojęzyczną sekcję witryny: https://example.ca/en/mountain-bikes.html lub https://en.example.ca/mountain-bikes.html. A te inne adresy URL informują użytkowników, że przeglądają tę samą stronę w języku francuskim: https://example.ca/fr/mountain-bikes.html lub https://fr.example.ca/mountain-bikes.html. Oprócz tego taka struktura adresów URL ułatwi Ci analizę indeksowania treści wielojęzycznych.

Jeśli chcesz tworzyć adresy URL ze znakami w języku innym niż angielski, używaj kodowania UTF-8. Adresy URL zakodowane w standardzie UTF-8 powinny mieć odpowiednio zmienione znaczenie, jeśli prowadzą do nich linki z zawartości Twojej witryny. W razie konieczności ręcznej zmiany znaczenia adresów URL możesz użyć kodera adresów URL online, który zrobi to za Ciebie. Jeśli na przykład chcesz przetłumaczyć ten adres URL z angielskiego na francuski (https://example.ca/fr/mountain-bikes.html), może on wyglądać np. tak: https://example.ca/fr/vélo-de-montagne.html. Ten adres URL zawiera 1 znak w języku innym niż angielski (é), dlatego tak wygląda on z prawidłowo zmienionym znaczeniem do użycia w linku na Twoich stronach: https://example.ca/fr/v%C3%A9lo-de-montagne.html.

Skanowanie i indeksowanie witryny wielojęzycznej

Odradzamy indeksowanie tłumaczeń automatycznych. Automatyczne tłumaczenia nie zawsze są sensowne i mogą być postrzegane jako spam. W tworzeniu witryn wielojęzycznych chodzi o to, aby dotrzeć do szerszego grona odbiorców, zapewniając im wartościowe treści w kilku językach. Jeśli Twoi użytkownicy nie rozumieją tłumaczenia automatycznego lub uważają je za sztuczne, zastanów się, czy naprawdę chcesz udostępniać im tego rodzaju treści.

Jeśli chcesz lokalizować treści, ułatw Googlebotowi indeksowanie wszystkich wersji językowych Twojej witryny. W takich przypadkach warto zastosować wzajemne linkowanie stron. Oznacza to, że możesz podać linki między stronami o tej samej treści w różnych językach. Może to też być bardzo pomocne dla użytkowników. Wracając do poprzedniego przykładu, załóżmy, że francuskojęzyczny użytkownik trafi na adres https://example.ca/en/mountain-bikes.html. Teraz wystarczy jedno kliknięcie, aby przejść do https://example.ca/fr/vélo-de-montagne.html i zobaczyć te same treści w języku francuskim.

Aby wszystkie treści w Twojej witrynie mogły być indeksowane, unikaj automatycznego przekierowania na podstawie wykrytego języka użytkownika. Takie przekierowania mogą uniemożliwiać użytkownikom (i wyszukiwarkom) przeglądanie wszystkich wersji Twojej witryny.

Pamiętaj też, aby treści w każdym języku przechowywać w oddzielnych adresach URL. Nie używaj plików cookie do wyświetlania przetłumaczonych wersji.

Praca z kodowaniem znaków

Google bezpośrednio wyodrębnia kodowanie znaków z nagłówków HTTP, nagłówków stron HTML i treści. Nie musisz wiele robić w przypadku kodowania znaków – wystarczy tylko unikać sprzecznych informacji – na przykład między treściami i nagłówkami. Google rozpoznaje różne kody znaków, ale zalecamy, aby w miarę możliwości używać w witrynie kodowania UTF-8.

Jeśli nie umiesz tego powiedzieć...

Jeśli Ty łamiesz sobie język na obcych językach, nie ma powodu, żeby takie same problemy miała Twoja witryna.

Więcej informacji znajdziesz w naszym poście na temat stron multiregionalnych i w kolejnym poście, w którym omówimy szczególne sytuacje, jakie mogą wystąpić podczas pracy z witrynami globalnymi. Zachęcamy do korzystania z Forum pomocy i dołączania do dyskusji.