使用 noindex
禁止 Google 搜尋建立索引
如果想避免某個網頁或資源顯示在 Google 搜尋中,可以在 HTTP 回應中加入 noindex
中繼標記或標頭。這樣一來,Googlebot 下次檢索該網頁並看到 noindex 標記或標頭時,Google 就會將該網頁完全排除在 Google 搜尋結果之外,不論是否有其他網站連結到該網頁,結果都一樣。
如果您沒有自身伺服器的根存取權,就很適合使用 noindex
,因為這樣就能輕鬆控制網站上每個網頁的存取權。
實作 noindex
實作 noindex
的方法有兩種,分別是使用中繼標記和 HTTP 回應標頭。這兩種做法的效果相同,請依照內容類別和網站情形選擇適合的即可。
<meta>
標記
如要防止「大部分搜尋引擎」將網站的特定網頁編入索引,請在網頁的 <head>
區段放入以下中繼標記:
<meta name="robots" content="noindex">
如要「專門防止 Google 網路檢索器」將特定網頁編入索引,請放入下列中繼標記:
<meta name="googlebot" content="noindex">
提醒您,有些搜尋引擎對 noindex
指令可能有不同的解譯方式,因此您的網頁仍可能出現在這些搜尋引擎的結果中。
HTTP 回應標頭
除了中繼標記之外,您也可以選擇在回應中傳回值為 noindex
或 none
的 X-Robots-Tag
標頭。回應標頭可用於非 HTML 資源,例如 PDF、影片檔案和圖片檔。以下範例說明如何在 HTTP 回應中利用 X-Robots-Tag
指示搜尋引擎不要將網頁編入索引:
HTTP/1.1 200 OK (…) X-Robots-Tag: noindex (…)
協助我們找到您的中繼標記
我們必須檢索您的網頁才能看到中繼標記和 HTTP 標頭。如果有網頁仍顯示在搜尋結果中,可能是因為我們在您新增標記後還未檢索過該網頁,您可以使用網址檢查工具來要求 Google 重新檢索網頁。此外,也可能是因為 robots.txt 檔案禁止 Google 網路檢索器存取該網址,才導致檢索器看不到標記。這種情況下,為了讓 Google 能夠存取網頁,您必須編輯 robots.txt 檔案。robots.txt 測試工具可協助您編輯及測試自己的 robots.txt 檔案。