HTTP 狀態碼對 Google 檢索器的影響

本頁說明各種 HTTP 狀態碼對 Google 檢索網路內容的影響,內容涵蓋 Google 在網路上最常遇到的 20 種狀態碼。較為罕見的狀態碼 (例如 418 (I'm a teapot)) 則不在本篇文章介紹範圍中。

HTTP 狀態碼

當代管網站的伺服器回應用戶端 (例如瀏覽器或檢索器) 發出的要求時,就會產生 HTTP 狀態碼。每個 HTTP 狀態碼各有不同意義,但經常代表相同的結果。舉例來說,有多種狀態碼會發出重新導向訊號,但其結果都相同。

Search Console 會針對 4xx—5xx 範圍中的狀態碼和失敗的重新導向 (3xx) 產生錯誤訊息。如果伺服器以 2xx 狀態碼回應,系統可能會將收到的回應內容納入索引。

下表列出 Google 最常遇到的 HTTP 狀態碼,並說明 Google 如何處理每個狀態碼。

HTTP 狀態碼

2xx (success)

Google 會查看網頁內容,再決定是否處理 (例如,如果是 Google 搜尋,則會決定是否建立索引)。如果內容疑似是 Google 搜尋的錯誤 (例如空白網頁或錯誤訊息),Search Console 就會顯示 soft 404 錯誤

200 (success)

Google 會將收到的內容傳遞至下一個處理步驟 (視產品而定)。 針對 Google 搜尋,下一個系統是索引管道。索引系統可能會對內容建立索引,但不保證一定如此。

201 (created)
202 (accepted)

Google 會等待一小段時間,然後將收到的任何內容傳送至下一個處理步驟 (視產品而定)。逾時時間視使用者代理程式而定,例如 Googlebot 行動裝置和 Googlebot 圖片的逾時時間可能有所差異。

204 (no content)

Google 無法接收任何內容,因此無法處理。

3xx (redirection)

根據預設,Google 檢索器最多會採用 10 個重新導向躍點。不過,特定產品的檢索器可能會有不同的限制。舉例來說,Googlebot 在檢索一般網路內容時,通常會採用 10 個重新導向躍點,但 Google 檢查工具不會採用重新導向。

Google 從重新導向網址中收到的所有內容都會遭到忽略,而最終目標網址的內容則有可能納入索引。針對 robots.txt 檔案,瞭解 Google 如何處理傳回 3xx 狀態碼的 robots.txt

301 (moved permanently)

Google 會採用重新導向,且 Google 系統會將重新導向視為強烈信號,表示應處理重新導向目標。

302 (found)

根據預設,Google 檢索器會採用重新導向,而 Google 系統會將重新導向視為微弱信號,表示應處理重新導向目標。其他產品可能會以不同方式處理重新導向。

303 (see other)
304 (not modified)

Google 檢索器會向後續處理系統發出信號,說明當前內容與上次檢索的內容相同。以 Google 搜尋為例,索引管道可能會重新計算網址的信號,但狀態碼並不會對索引作業造成任何影響。

307 (temporary redirect) 等同於 302
308 (moved permanently) 等同於 301

4xx (client errors)

Google 不會使用傳回 4xx 狀態碼的網址內容。如果網址先前曾使用過,但現在會傳回 4xx 狀態碼,Google 系統會逐漸停止使用該網址。以 Google 搜尋為例,Google 不會對傳回 4xx 狀態碼的網址建立索引,並且會將已建立索引並傳回 4xx 狀態碼的網址從索引中移除。

系統會忽略 Google 從傳回 4xx 狀態碼的網址收到的所有內容。

400 (bad request)

除了 429 以外,其餘 4xx 錯誤都會以同樣的方式處理:Google 檢索器會通知下一個處理系統,說明網頁內容不存在。

如果是 Google 搜尋,索引管道會將先前已建立索引的網址從索引中移除,同時也不會處理新檢索的 404 網頁。 檢索頻率會逐漸降低。

401 (unauthorized)
403 (forbidden)
404 (not found)
410 (gone)
411 (length required)
429 (too many requests)

Google 檢索器會將 429 狀態碼視為伺服器超載的信號,並判定為伺服器錯誤。

5xx (server errors)

5xx429 伺服器錯誤會促使 Google 檢索器暫時降低檢索頻率。對於 Google 搜尋,系統會將已建立索引的網址保留在索引中,但最終會予以移除。

系統會忽略 Google 從傳回 5xx 狀態碼的網址收到的所有內容。針對 robots.txt 檔案,瞭解 Google 如何處理傳回 5xx 狀態碼的 robots.txt

伺服器開始傳回 2xx 狀態碼後,Google 會逐步提高網站的檢索頻率。

500 (internal server error)

Googlebot 會降低網站檢索頻率。檢索頻率降低時,即表示傳回伺服器錯誤的個別網址數量增加。如果是 Google 搜尋,Google 的索引管道會將持續傳回伺服器錯誤的網址從索引中移除。

502 (bad gateway)
503 (service unavailable)