避免 Google 搜尋顯示受遮蓋的資訊

在網路上發布文件和圖片時,您可能會不小心發布肉眼無法立刻察覺的資訊。特別是,您看不到的資訊或是刻意遮蓋的資訊,可能會以某種文件格式包含在內容中,讓搜尋引擎得以一覽無遺。

由於搜尋引擎會為網路上的公開內容 (包括圖片) 建立索引,因此未完全遮蓋的內容還是有可能讓搜尋引擎找到。如果使用者使用螢幕閱讀器等輔助技術,將會更容易取得這類看似「隱藏」的內容,而常見的圖片辨識技術 (例如光學字元辨識 (OCR)) 同樣也可能讓使用者搜尋到這類內容。

有些人會選擇將文字字型縮小並使用與背景相同的顏色,或者以圖片遮住文字,雖然這類方法能讓使用者無法以肉眼看到資訊,但實際上並未真正遮蓋內容,因此無法避免搜尋引擎為其建立索引或顯示在搜尋結果中。

同樣地,某些文件類型會以各種形式包含我們無法立刻看見的資訊。這些文件類型可能會含有文件的變更記錄,可讓使用者查看經過遮蓋或修改的文字,也可能保留資訊受到裁剪或遮蓋前的完整版圖片。甚至,如果檔案含有中繼資料,雖然使用者無法立刻看見,但其中也可能列出曾經存取或編輯過檔案的使用者名稱。

即使文件是由其他檔案匯出,或曾在不同格式之間轉換,上述這些資訊也全都會保留下來。因此,如果您需要從檔案中移除特定資訊,請務必在檔案公開發布之前完全移除該資訊。

以下提供一些最佳做法,說明如何適當地遮蓋您不想要 Google 建立索引的文件資訊,並讓其他人無法透過 Google 搜尋找到這些資訊。

在嵌入圖片之前先進行編輯並匯出

Google 搜尋會列出系統在網路上找到的圖片,這些圖片可能位在網頁上,或者內嵌於各種格式的文件中。有些使用者在編輯內嵌的圖片時,會直接使用內嵌文件本身的編輯工具,如果系統將這類圖片與該文件分別建立索引,就會導致遮蓋失敗。因此我們建議,請務必先編輯圖片,再將圖片嵌入文件。我們特別建議您採取以下做法:

  • 先裁剪掉不想要出現在圖片中的資訊,再將圖片嵌入文件。某些文件編輯工具 (例如文書處理軟體或投影片製作工具) 會保留您放在公開版文件的未裁剪圖片,因此請務必詳閱工具的說明文件。
  • 完整移除或遮蓋圖片中所有文字或不想公開的部分,因為 OCR 系統會將圖片上可見的任何文字轉換為可搜尋的文字。
  • 移除所有不需要的中繼資料。

完成本文件提供的建議操作後,請匯出更新後的圖片,或者儲存為非向量或平面化圖片檔案格式 (例如 PNG 或 WEBP),這麼做可以防止圖片的這些部分不小心出現在公開文件中。

先編輯或移除不需要的文字,再轉換為公開檔案格式

產生公開版文件之前,請移除任何您不希望在檔案最終版本顯示的文字,並選擇使用不會保留先前變更記錄的公開格式。以下提供幾項更具體的操作提示:

  • 如要遮蓋檔案中的資訊,請使用適當的文件遮蓋工具。舉例來說,請避免採用以黑色矩形蓋住文字的遮蓋方法,因為即使這麼做,文字還是可能會出現在公開文件中。
  • 再三確認公開檔案的文件中繼資料。
  • 依照使用的檔案格式 (PDF、圖片等),遵循適用的文件遮蓋最佳做法
  • 請記得將網址或檔案名稱中的資訊納入考量。即使您已使用 robots.txt 封鎖網站的部分內容,在搜尋中系統仍可能為網址本身 (不含其內容) 建立索引。因此,請不要在網址參數中使用電子郵件地址或名稱,而是改用雜湊值。
  • 考慮使用驗證功能限制存取受遮蓋的內容。在該登入頁面使用 noindex robots meta 標記來禁止建立索引。
  • 發布網站前,請確定您已在 Google Search Console 中驗證網站,這能讓您在需要時快速移除特定項目。
  1. 將目前的文件從發布的網站或位置中移除。
  2. 對已驗證的網站使用移除工具,從 Google 搜尋移除相關文件。如果需要移除多個文件,請使用網址前置字元。如果網站已通過驗證,網址移除程序通常不到一天就會完成。如此一來,當使用者搜尋遮蓋的內容時,就不會看到相關文件。
  3. 請透過不同網址代管已完整遮蓋的文件。因為重新檢索網址以及更新搜尋索引中的網址需要一些時間,這麼做能確保所有新建立的索引版本依據都是新版文件,而非舊版文件。請記得更新指向這些文件的任何連結。
  4. 如有任何其他網站也代管這些遮蓋不完全的文件,請與該網站聯絡,要求對方移除這些文件。他們可以透過自己 Search Console 帳戶中的「移除工具」執行移除動作,或者您也可以使用「移除過舊的內容」工具要求 Google 系統更新搜尋結果。
  5. 等待網址移除要求過期。在系統更新 Google 搜尋索引中的網址後,或大概經過 6 個月時間,要求便會過期。