Duplex on the Web 使用者代理程式

DuplexWeb-Google 是支援 Duplex 網頁版服務的使用者代理程式,您可以查看這裡的說明,瞭解使用者代理程式權杖和完整的使用者代理程式字串。

檢索頻率和行為

  • 凡是使用 DuplexWeb-Google 的服務,都不會在檢索您的網站時執行任何交易行為或其他重大操作。
  • 取決於接受訓練的功能種類,DuplexWeb-Google 檢索網站的頻率可能從一天數次到一小時數次;不過請放心,這些頻率經過計算,不會造成網站過載,也不會干擾流量。
  • Google 搜尋服務不會使用 DuplexWeb-Google 的檢索資料來建立索引。由於 DuplexWeb-Google 使用者代理程式的用途不是建立索引,所以無法辨識 noindex 指令
  • Google Analytics (分析) 不會記錄 DuplexWeb-Google 在檢索及分析期間提出的網頁要求。

運用 robots.txt 規則控管檢索作業

如果不想讓 DuplexWeb-Google 檢索您的網站,就必須使用 Disallow robots.txt 規則明確封鎖 DuplexWeb-Google。如果只有在 Search Console 資源設定中停用檢索 (訓練) 功能,無法阻止 DuplexWeb-Google 檢索網站。

DuplexWeb-Google 一般都會遵循 robots.txt 規則,但有一種重要的例外情況:

  • 在 Search Console 中啟用 Google Duplex 網頁版時 (預設環境),DuplexWeb-Google 使用者代理程式就不受 Disallow 陳述式中的 * 萬用字元使用者代理程式字串影響。但如果在 Search Console 中停用 Google Duplex 網頁版,DuplexWeb-Google 使用者代理程式便會遵循 Disallow 陳述式中有 * 萬用字元的使用者代理程式字串。範例:

# Example 1: Block DuplexWeb-Google from crawling your site
User-agent: DuplexWeb-Google
Disallow: /

# Example 2:
# * If Duplex on the web is enabled for this property in Search Console,
#   block all user agents except DuplexWeb-Google.
# * If Duplex on the web is disabled for this property in Search Console,
#   block all user agents including Duplex-WebGoogle.
User-agent: *
Disallow: /