多地域、多言語のサイトの管理
言語、国、または地域によって異なるコンテンツをユーザーに提供しているサイトの場合、Google 検索結果を最適化することができます。
背景
- 多言語のウェブサイトとは、複数の言語でコンテンツを提供するウェブサイトです。たとえば、カナダの企業のサイトに、英語版とフランス語版を設ける場合です。Google 検索は、検索ユーザーの言語と一致するページを探します。
- 多地域のウェブサイトとは、異なる複数の国のユーザーを明示的にターゲットにしているウェブサイトです。たとえば、カナダと米国の両方に製品を発送するメーカーの場合です。Google 検索は、検索ユーザーにとって適切な地域のページを探します。
サイトの中には、多地域でかつ多言語のサイトもあります(たとえば、米国版とカナダ版があり、カナダ版のコンテンツにフランス語版と英語版があるサイトがこれに該当します)。
多言語サイトを管理する
サイトで同一のコンテンツが複数の言語によって提供されている場合、ユーザー(と Google 検索)が適切なページを見つけられるようにするためのおすすめの方法をここで紹介します。
言語のバージョンごとに異なる URL を使用する
Google では、ページの各言語のバージョンに異なる URL を使用することをおすすめします。Cookie やブラウザの設定を使用してページ上のコンテンツの言語を調整する方法はおすすめしません。
言語ごとに異なる URL を使用する場合は、hreflang アノテーションを使用して、Google 検索結果がページの適切な言語のバージョンにリンクできるようにします。
ユーザーの言語設定に応じて、動的にコンテンツを変更する方法や、ユーザーをリダイレクトする方法を採用する場合は、コンテンツのすべてのパターンを Google が見つけてクロールするとは限らないことにご注意ください。これは、Googlebot のクローラが通常は米国から起動されるためです。さらに、クローラが送信する HTTP リクエストのヘッダーには、Accept-Language
は設定されません。
複数の言語のバージョンがあることを Google に知らせる
言語や対象地域が異なるページのバージョンにラベルを付けて Google に知らせる方法は複数あります(hreflang アノテーション、サイトマップなど)。ページに適宜マークを付けてください。
ページの言語が明確にわかるようにする
Google は、表示されるコンテンツからページの言語を判断します。lang
属性のようなコードレベルの言語情報や、URL は使用しません。Google が言語を正しく判断できるように、各ページのコンテンツとナビゲーションには 1 つの言語を使用し、原文と訳文を一緒に表示することは避けてください。
ページの定型文のみが翻訳されて、コンテンツの大部分が 1 つの言語のままになっていると(ユーザー作成コンテンツが含まれるページでよく見られます)、同じコンテンツが何度も、それぞれ異なる言語の定型文とともに検索結果として表示されるため、ユーザーにとっては不便です。
robots.txt を使用して、自動翻訳したサイトページが検索エンジンからクロールされないようにしてください。自動翻訳は意味が通じない場合があるため、スパムとみなされる可能性があります。さらに重要なこととして、読みにくく不自然な翻訳はサイトのイメージ低下につながるおそれがあります。
ページの言語をユーザーが切り替えられるようにする
ページに複数のバージョンがある場合:
- 他の言語のバージョンへのハイパーリンクを追加することを検討してください。それによって、ユーザーがクリックするだけで、そのページの別言語のバージョンを選択できるようにします。
- ユーザーの言語を認識して自動的にリダイレクトすることは避けてください。このようなリダイレクトを行うと、ユーザー(と検索エンジン)がサイトのすべての言語バージョンを見られなくなる場合があります。
言語ごとの URL を使用する
URL にローカライズした単語を使用したり、国際化ドメイン名(IDN)を使用したりしてもかまいません。ただし、必ず URL には UTF-8 エンコードを使用し(可能な場合は常に UTF-8 を使用することをおすすめします)、リンクする際には URL を適切にエスケープするようにしてください。
特定の国をサイト コンテンツのターゲットに設定する(地域ターゲティング)
特定の言語を話す特定の国のユーザーを、ウェブサイトやその一部のターゲットに設定できます。これにより、対象国でのページ ランキングは向上しますが、他の地域や言語の結果に悪影響がおよぶことがあります。
Google でサイトの地域ターゲティングを設定するには
- ページまたはサイトのレベル: サイトまたはページに地域や言語ごとの URL を使用します。
- ページレベル: hreflang またはサイトマップを使用して、どの地域または言語にどのページが該当するかを Google に知らせます。
- サイトレベル: サイトにジェネリック トップレベル ドメイン(gTLD、例: .com、.org、.eu)がある場合、インターナショナル ターゲティング レポートを使用してサイトのターゲットに設定する言語や地域を指定します。サイトで複数の国を対象にしている場合はこのツールを使用しないでください。たとえば、モントリオールのレストランに関するサイトでカナダをターゲットに設定するのは妥当ですが、フランス、カナダ、マリのフランス語を話すユーザーも対象にするサイトで、カナダをターゲットに設定するのは問題があります。
地域ターゲティングは誤ることもあるため、サイトの「間違った」バージョンがユーザーに表示された場合を考慮することが重要です。地域や言語を選択できるリンクをすべてのページに表示することも一つの方法です。
地域ごとの URL を使用する
サイトまたはその一部に対して、異なる地域を簡単にターゲティングできる URL 構造を使用するようにしてください。URL 構造の選択肢を次の表に示します。
URL 構造 | URL の例 | 長所 | 短所 |
国別のドメイン | example.de |
|
|
gTLD を使用するサブドメイン | de.example.com |
|
|
gTLD を使用するサブディレクトリ | example.com/de/ |
|
|
URL パラメータ | site.com?loc=de |
|
|
ターゲットの地域を Google はどのように認識するか
Google は以下の情報に基づいて、ページにとって最良なターゲット ユーザーを判断します。
- Search Console のインターナショナル ターゲティング レポートに指定されたターゲットの地域。ジェネリック トップレベル ドメイン(gTLD)を使用し、別の国ではホスティング プロバイダを使用している場合、Search Console を使って、サイトが関連する国を Google に知らせることをおすすめします(サイトの地域ターゲティングを設定する場合)。
- 国別コード トップレベル ドメイン名(ccTLD): これらのドメイン名は特定の国に結び付けられているため(例: .de はドイツ、.cn は中国)、ユーザーと検索エンジンは、サイトが特定の国をターゲットにしていることをすぐに認識できます(国によっては制限があり、誰でも ccTLD を使用できるとは限らないため、ご注意ください)。また、Google は一部のバニティ ccTLD(.tv や .me など)を gTLD として扱います。このようなドメインは、特定の国をターゲットとするものではなく「ジェネリック」と見なすユーザーやウェブサイトの所有者が多いためです(Google が gTLD として扱うようなバニティ ccTLD は時間とともに変化するため、それ自体の完全な一覧は提供していません)。Google の gTLD の一覧をご覧ください。
- タグ、ヘッダー、サイトマップのいずれかに指定されている hreflang ステートメント
- サーバーの場所(サーバーの IP アドレスを使用): サーバーは物理的にユーザーの近くにある場合が多いため、サーバーの場所はサイトのターゲット ユーザーを判断する手がかりとなります。ウェブサイトは、分散 CDN(コンテンツ配信ネットワーク)を使用している場合やウェブサーバー インフラの充実した国でホストされている場合があるため、サーバーの場所は信頼性の高い情報ではありません。
- その他の情報: サイトのターゲット ユーザーを判断するその他の手がかりには、ページに記載されている住所や電話番号、使用されている言語や通貨、他のローカルサイトからのリンク、Google マイビジネスの利用(利用できる場合)などがあります。
Google が行わないこと:
- Google は世界中のさまざまな場所からウェブをクロールします。しかし、ページの別のパターンがあるかどうかを探すために、1 つのサイトに使用されているクローラソースを変えることはありません。そのため、サイトが公開している地域や言語ごとのバージョンは、ここに記載した方法(hreflang の指定、ccTLD、明示的なリンクなど)で Google に通知される必要があります。
- Google は場所のメタタグ(
geo.position
、distribution
など)や、地域ターゲティングの HTML 属性は無視します。
多言語、多地域のサイトでの重複ページを処理する
多地域のサイトの一部で同じ言語を使って同様のまたは重複するコンテンツを異なる URL で提供する場合(たとえば、example.de/
と example.com/de/
の両方でドイツ語の同様のコンテンツが表示される場合)、優先するバージョンを選択し、rel="canonical"
要素と hreflang タグを使って、適切な言語や地域の URL が検索ユーザーに提供されるようにする必要があります。
ジェネリック トップレベル ドメイン
ジェネリック トップレベル ドメイン(gTLD)は、特定の地域に関連付けられていないドメインです。ジェネリック トップレベル ドメイン(.com や .org など下記に示すドメイン)を持つサイトで特定の地域のユーザーをターゲットに設定する場合は、上記のいずれかの方法でターゲットにする国を明示的に設定する必要があります。
Google では、以下を Search Console での地域ターゲティングが可能な gTLD として扱います。
- ジェネリック トップレベル ドメイン(gTLD): トップレベル ドメインが ICANN で国コード トップレベル ドメイン(ccTLD)として登録されている場合を除き、Google は IANA DNS ルートゾーンで名前が解決する TLD を gTLD として扱います。例:
- .com
- .org
- .edu
- .gov
- ...他多数
- ジェネリック地域トップレベル ドメイン: 以下のドメインは地域に関連付けられていますが、通常はジェネリック トップレベル ドメインとして、つまり .com や .org と同様に扱われます。
- .eu
- .asia
- ジェネリック国別コード トップレベル ドメイン(ccTLD): Google はいくつかの ccTLD(.tv、.me など)を gTLD として扱います。このようなドメインは、特定の国をターゲットとするものではなく「ジェネリック」と見なすユーザーやウェブサイトの所有者が多いためです。こうした ccTLD の一覧を示します(この一覧は変更される可能性があります)。
- .ad
- .as
- .bz
- .cc
- .cd
- .co
- .dj
- .fm
- .io
- .la
- .me
- .ms
- .nu
- .sc
- .sr
- .su
- .tv
- .tk
- .ws