Googlebot について、よくある質問

2009年6月24日水曜日

ウェブマスターヘルプフォーラムに、Googlebot や robots.txt に関する質問が多く寄せられたので、少々古い記事にはなりますが、 2006 年に英語版ウェブマスターセントラルブログに掲載された記事が、皆様の参考になればと、抄訳して掲載します。

サイトをメンテナンスのために落としています。Googebot に「メンテナンス中」のページをインデックスさせるのではなく、後でクロールに戻って来るよう伝えたいのですが、どうしたらいいですか？

サーバーが、200 （成功）ではなく、503 （ネットワーク利用不可）の HTTP ステータスコードを返すように設定してください。こうすることで、Googlebot はまた別の機会にクロールを試みるようになります。

Googlebot がサイトをクロールする負荷が高すぎる場合はどうしたらいいのですか？

ウェブマスターツール内 [サイト設定] の [クロール速度] セクションで、希望のオプションを選択していただくことができます。

Robots メタタグと robots.txt ファイルはどちらを使うのが望ましいのですか？

Googlebot はどちらの指示にも従いますが、robots メタタグはページ毎に記述する必要があります。もしクロールされたくないページが多数ある場合は、robots.txt ファイルを使って一度にそれら複数のページへのアクセスをブロックできるようサイトを構成すると、設定が簡単になります（例えば、それらのページをひとつのディレクトリにまとめるなど）。

Robots.txt に、全ての検索エンジンのボット（クローラ）を対象にした記述と、Googlebot のみを対象にした記述が混在している場合、全ての検索エンジンを対象にした記述を Googlebot はどのように解釈するのですか？

あるサイトの robots.txt に、全てのボット向けの指示と、Googlebot に限定した指示の両方が含まれている場合、Googlebot は後者を優先します。

例えば、次のような記述の robots.txt ファイルがある場合、

User-agent: *
Disallow: /

User-agent: Googlebot
Disallow: /cgi-bin/

Googlebot は、サイトの cgi-bin ディレクトリ以外のページを全てクロールします。

次のような記述の robots.txt ファイルがある場合は、

User-agent: *
Disallow: /

Googlebot は、サイトのページを一切クロールしません。

あなたのサイトの robots.txt ファイルを Googlebot がどのように解釈しているかは、ウェブマスターツールの robots.txt のテストを使って確認することができます。また、robots.txt ファイルに変更を加えた場合、Googlebot がどのように解釈するようになるかについても、このツールで試すことができます。

Googlebot （や Google のその他のクローラ群）がどのように robots.txt を解釈するかについて、より詳しく知りたい方はヘルプセンターをご参照下さい。

Posted by サーチクオリティチーム

Googlebot について、よくある質問 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

Googlebot について、よくある質問