保持簡單的網址結構

網站的網址結構應該盡可能簡單。請試著組織網站內容,以有邏輯的方式來架構網址,讓人能夠容易理解,可以的話,請盡量使用可閱讀的字詞而非冗長的 ID 編號。舉例來說,當在搜尋航空的相關資訊時,「http://en.wikipedia.org/wiki/Aviation」這樣的網址將有助於您決定是否要按下這個連結;而像「http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1」這樣的網址就比較不容易吸引使用者。

您可以試著在網址中使用標點符號。例如 http://www.example.com/green-dress.html 就比 http://www.example.com/greendress.html 更實用。建議您在網址中使用連字號 (-),而不要使用底線 (_)。

太過複雜的網址可能會影響檢索器效能。特別是那些包含多個變數的網址,它們會針對網站上相同或類似的內容建立不必要的大量網址,導致 Googlebot 平白占用更多頻寬,甚至無法為網站的所有內容建立索引。

這個問題的常見原因

造成網址數量過多的原因有很多種,其中包括:

  • 對單一組項目進行多重篩選。許多網站能讓您以不同方式檢視同一組項目或搜尋結果,通常是允許使用者透過預先定義好的條件來篩選某一組項目,例如「顯示海灘旅館」。如果系統允許組合多個篩選器,例如「顯示有健身中心的海灘旅館」,那麼網站中的網址數量 (也就是資料的檢視方式) 就會大幅增加。建立大量只有些微差異的旅館清單並無必要,因為 Googlebot 僅需要查看少量清單即可造訪每個旅館的網頁。舉例來說:
    • 「平價」旅館:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • 海灘上的「平價」旅館:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • 海灘上附有健身中心的「平價」旅館:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • 動態產生文件。這類做法會讓網址因為計數器、時間戳記或廣告而產生些微差異。
  • 網址中的問題參數。例如,工作階段 ID 會建立大量重複項目和海量網址。
  • 排序參數。有些大型購物網站提供多種方式來排序相同的項目,因而產生大量網址。例如:
    http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
  • 網址包含無關的參數,像是參照連結網址參數。例如:
    http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
    http://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    http://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • 日曆問題。動態產生的日曆可能產生連向未來與過去日期的連結,但這些連結並未針對起始或結束日期設下任何限制。例如:
    http://www.example.com/calendar.php?d=13&m=8&y=2011
    http://www.example.com/calendar/cgi?2008&month=jan
  • 損毀的相關連結。損毀的相關連結可能會產生無限空間,這種問題通常是重複的路徑元素所造成。例如:
    http://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

解決問題

如要避免網址結構可能造成的問題,建議採取下列做法:

  • 請考慮透過 robots.txt 檔案禁止 Googlebot 存取有問題的網址。一般說來,您應該考慮封鎖動態網址,例如:產生搜尋結果的網址,或是可能建立無限空間的網址 (例如日曆)。只要在 robots.txt 檔案中使用規則運算式,即可輕鬆封鎖大量網址。
  • 盡可能避免在網址中使用工作階段 ID,並考慮改用 Cookie。 如需更多資訊,請參閱我們的網站管理員指南
  • 刪去不必要的參數,盡可能縮短網址。
  • 如果您的網站有無限日曆,請在指向動態產生未來日曆網頁的連結中加入 nofollow 屬性
  • 檢查網站是否有損毀的相關連結。