HTTP ヘッダーでの rel="canonical" 属性に対応しました

2011年7月29日金曜日

みなさまからのご要望にお応えし、このたび、Google 検索は IETF RFC 5988 のセクション 5 (英語)に記載のシンタックスに従って HTTP ヘッダーで指定された link rel="canonical" 属性 に対応いたしました。rel="canonical" を有する HTTP ヘッダーを使用することで、HTML 文書だけでなく、それ以外の形式のコンテンツ(PDF ファイルなど)についても canonical URL(優先する URL)を設定することが可能になります。

では実際に、rel="canonical" を指定した HTTP ヘッダーがどのような働きをするか、HTML ページ版と PDF ダウンロード版の両方で文書を提供しているウェブサイトを例に見ていきましょう。HTML 版と PDF 版の URL はそれぞれ下記のとおりとします。
https://www.example.com/white-paper.html
https://www.example.com/white-paper.pdf

このケースでは、PDF ファイルが要求された時に rel="canonical" HTTP ヘッダーを使用することによって、優先する URL が上記 HTML 文書であることを Google に通知することができます。

記述例:
GET /white-paper.pdf HTTP/1.1
Host: www.example.com
(...以下、他の HTTP リクエスト ヘッダー...)

HTTP/1.1 200 OK
Content-Type: application/pdf
Link: <https://www.example.com/white-paper.html>; rel="canonical"
Content-Length: 785710
(...以下、他の HTTP レスポンス ヘッダー...)

他にも、rel="canonical" を設定した HTTP ヘッダを活用できる代表的なケースとして、ウェブサイトが同一ファイルを複数の URL から提供している場合(コンテンツ配信ネットワークを使用している場合など)に、Google に対して優先する URL を通知したいといったケースが挙げられます。
これらのリンク ヘッダー要素は、現時点では Google においては検索でしか対応していませんが、ウェブマスターのみなさまの利用状況を考慮しながら、Google の他のサービスにおいても対応できるようにしたいと考えております。

詳しくは、 正規化 および rel="canonical" 属性 に関するヘルプセンターの記事をご参照ください。ご質問やご意見がありましたら、 ウェブマスター ヘルプ フォーラム へお寄せください。