404 エラーがサイトに与える悪影響

2011 年 5 月 2 日(月曜日)

ウェブマスター ツールを使って自分のサイトの状態を確認したところ、クロールエラー ページが 404 (Not found) エラーでいっぱいになっていたとします。このような場合、いったいどうしたらよいのでしょうか。

ウェブマスター ツールのクロールエラー機能

心配する必要はありません。この記事では、404 エラーと、このエラーがサイトに及ぼす影響について説明します。

Q: ウェブマスター ツールで報告される 404 エラーはサイトのランキングに影響しますか?
A: 404 エラーは、ウェブの動作としてまったく正常なものです。インターネットは常に変化しており、新しいコンテンツが作られ、古いコンテンツはなくなっていきます。コンテンツがなくなっている場合、通常は 404 HTTP レスポンス コードが返されます。検索エンジンはこのことを理解しています。上記の例のように、Google のサイトにも 404 エラーはあり、このエラーはインターネットの至るところで見られます。サイトからページが削除された場合は、soft 404 よりも、正しい 404 または 410 レスポンス コードが返されるほうが検索エンジンにとっては望ましいのです。Google のクローラーが URL の HTTP レスポンス コードを確認するためには、その URL をクロールする必要があります。そのため、該当の URL が robots.txt ファイルでブロックされていると、クロールしてレスポンス コードを確認することができません。サイトの一部の URL が存在しなくなったり、404 を返したりしても、検索結果におけるサイトの他の URL(200 (Success) ステータス コードを返すもの)のランキングには影響しません。

Q: では、404 エラーがウェブサイトに悪影響を及ぼすことはないのですか?
A: サイトの一部の URL が 404 を返しているということ自体が、サイト所有者の評価や Google の検索結果に影響することはありません。ただし、一部の 404 エラーに対しては対処が必要です。たとえば、404 を返しているページがサイトにとって重要なページである場合は、なぜクロール時に 404 エラーが出ているのか調査すべきです。URL のスペルミス(www.example.com/awesome を誤って www.example.com/awsome としている場合など)がある場合は、誰かがサイトにリンクしようとしてタイプミスをしていることが考えられます。404 を返す代わりに、301 リダイレクトを使用して正しい URL にリダイレクトすれば、そのリンクからのトラフィックを得ることができます。また、ユーザーがサイトの 404 ページにアクセスした場合、「404 Not found」とだけ表示するのではなく、ユーザーにとって便利なページを用意することもできます。

Q: 「soft 404 エラー」について詳しく教えてください。
A: soft 404 エラーとは、ウェブサーバーが、存在しない URL に対して 404(または 410)以外のレスポンス コードを返す状態を指します。一般的な例としては、サイト所有者がユーザーにとって便利な 404 ページを提供したいと考え、そのようなコンテンツを提供するには必ず 200 レスポンス コードを返さなければならないと思っている場合です。しかし、404 を返しつつそのようなコンテンツを提供することは可能です。他の例としては、未知の URL に対して 404 を返す代わりにホームページにリダイレクトしている場合があります。どちらの場合も、Google がサイトを分析してインデックスに登録するのに支障が出る可能性があるため、存在しないコンテンツに関しては適切なレスポンス コードを返すことをおすすめします。ページに「404 Not Found」と書かれているからといって、実際に 404 HTTP レスポンス コードを返しているとは限りません。ウェブマスター ツールの Fetch as Googlebot 機能を使用して、そのページを再度確認してください。サーバーが正しいレスポンス コードを返すように設定する方法がわからない場合は、ホスティング サービスのヘルプ ドキュメントをご覧ください。

Q: URL が 404301410 のうちどれを返すべきか判断するにはどうすればよいですか?
A: サイトからページを削除する際には、そのコンテンツを別の場所に移動するのか、それとも今後サイト内に同種のコンテンツを置く予定はないのかを考えるようにします。コンテンツを新しい URL に移動する場合は、元の URL から新しい URL に 301 リダイレクトします。これにより、そのコンテンツを求めて元の URL にアクセスしたユーザーを、目的の情報に関連するコンテンツに自動的に誘導できます。そのコンテンツを完全に削除する予定であり、そのコンテンツを求めているユーザーの要望を満たすものも一切自分のサイトに置かない場合は、ユーザーが古い URL にアクセスしたときに 404 または 410 が返されるようにしてください。現在、Google は 410 (Gone)404 (Not found) と同じように処理します。そのため、どちらを返してもかまいません。

Q: 404 エラーのほとんどが、サイトに存在しない URL に対するものです。 これはどのようなトラフィックで、どこから来たのでしょうか?
A: 通常 Google は、ウェブ上のどこかであなたのサイト内へ張られたリンクを検出すると、コンテンツの有無を問わずそのリンクをクロールします。その URL が存在しない場合、サーバーは 404 を返す必要があります。こういった無効なリンクが発生する理由はいくつか考えられます。たとえば、サイトにリンクしようとした誰かがスペルミスをした場合、設定ミスの場合(CMS によってリンクが自動生成されているなど)、Google のクローラーが JavaScript や他の埋め込みコンテンツ内のリンクを認識してクロールしようとした場合、サーバーが未知の URL をどのように処理するかを Google が確認しようとした場合などです。サイトに存在しない URL に対してウェブマスター ツールが 404 を報告した場合は、無視しても問題ありません。Google は、サイトにとって重要な URL と、404 を返すべき URL を判別できません。このため、サイトで検出されたすべての 404 を報告し、対応が必要かどうかはサイト所有者の判断に任せています。

Q: サイトをスクレイピングされたため、大量の 404 エラーが発生しました。「https://www.example.com/images/kittens.jpg" width="100" height="300" alt="kittens"/>」のような、実在する URL に他のコードが付け加えられたものです。これはサイトに悪影響を及ぼしますか?
A: 一般的に、このような「無効なリンク」がサイトに悪影響を及ぼすことはありません。Google は、サイト所有者側ではスクレイピングを行う者や、普通でない方法でリンクしようとする者を制御できないことを理解しています。正規表現を使いこなせる場合は、これらの URL をリダイレクトすることもできますが、通常は心配しなくても大丈夫です。また、サイトからコンテンツが盗用された確信がある場合は、著作権侵害の申し立てを行うこともできます。

Q: 先週、ウェブマスター ツールで報告された 404 エラーをすべて修正したのですが、まだ一覧に記載されています。正しく修正できなかったということでしょうか?エラーが表示されなくなるまでどれくらいかかりますか?
A: [クロールエラー] ページの [最終検出] 列をご覧ください。これは各エラーが検出された最新の日付を示しています。列の日付がエラーを修正した日より前であれば、それ以降そのエラーは発生していないことを意味します。日付が修正した日より後である場合は、それ以降もクロール時に 404 が発生していることになります。

修正後に Fetch as Googlebot を使用すると、クローラーが新しいレスポンス コードを認識できているかどうかを確認できます。いくつかの URL でテストして問題がなければ、それらはクロールエラーの一覧から消えていくはずです。

Q: アカウントから 404 エラーを早く消去するために、Google の URL の削除ツールを使ってもよいですか?
A: URL 削除ツールは Google の検索結果から URL を削除するためのものであり、ウェブマスター ツールのアカウントから削除するためのものではありません。404 を返すページはいずれ検索結果には表示されなくなるため、緊急の削除要請用のツールを使う必要はありません。URL 削除ツールを使用すべき場合とそうでない場合について詳しくは、このブログ投稿の後半をご覧ください。

404 エラーについてさらに詳しく知りたい方は、ブログの 404 特集をご覧いただくか、ウェブマスター ヘルプ フォーラムにお問い合わせください。