การกําหนดหน้า Canonical ของหน้าเว็บที่ซ้ำกันและการใช้แท็ก Canonical

หากคุณมีหน้าเว็บเดียวที่เข้าถึงได้จาก URL หลายรายการ หรือมีหน้าเว็บหลายหน้าที่มีเนื้อหาคล้ายกัน (เช่น หน้าเว็บที่มีทั้งรุ่นอุปกรณ์เคลื่อนที่และรุ่นเดสก์ท็อป) Google จะมองว่าเป็นเวอร์ชันที่ซ้ำของหน้าเว็บเดียวกัน Google จะเลือก URL 1 รายการเป็นเวอร์ชัน Canonical และรวบรวมข้อมูลจาก URL ดังกล่าว และถือว่า URL อื่นๆ ทั้งหมดเป็น URL ที่ซ้ำ และจะรวบรวมข้อมูลจาก URL อื่นเหล่านั้นไม่บ่อย

หากคุณไม่ได้บอก Google ว่า URL ใดเป็น Canonical URL ไว้อย่างชัดแจ้ง Google จะเลือกให้เอง หรืออาจพิจารณาทั้ง URL ที่เราเลือกและที่คุณเลือกโดยให้น้ำหนักเท่ากัน ซึ่งอาจทำให้เกิดลักษณะการทำงานที่ไม่พึงประสงค์ตามที่อธิบายไว้ด้านล่างในเหตุผลที่ใช้ในการเลือก Canonical URL

เอกสารนี้อธิบายวิธีการทํางานของการกําหนดหน้า Canonical ของ URL ใน Google Search, การดูว่าจะต้องระบุ Canonical URL หรือไม่ และวิธีระบุค่ากําหนดของคุณไปยัง Google

Canonical URL คืออะไร

Canonical URL คือ URL ของหน้าที่ Google คิดว่าเป็นตัวแทนที่ดีที่สุดของหน้าต่างๆ ที่ซ้ำกันในเว็บไซต์ของคุณ ตัวอย่างเช่น หากคุณมี URL หลายรายการสําหรับหน้าเดียวกัน (example.com?dress=1234 และ example.com/dresses/1234) Google จะเลือก URL หนึ่งเป็น Canonical URL

หน้าที่ซ้ำกันไม่จำเป็นจะต้องเหมือนกันทุกประการ การจัดเรียงหรือการกรองหน้ารายการที่มีการเปลี่ยนแปลงเล็กน้อยไม่ได้ทำให้หน้าแตกต่างกัน (เช่น การจัดเรียงตามราคาหรือการกรองตามสีของสินค้า) Canonical URL อาจอยู่ในโดเมนอื่นก็ได้ ไม่ใช่ URL 2 รายการที่ซ้ำกัน

วิธีที่ Google จัดทำดัชนีและเลือก Canonical URL

เมื่อจัดทำดัชนีเว็บไซต์ Google จะพยายามระบุเนื้อหาหลักของแต่ละหน้า หากพบว่าในเว็บไซต์เดียวกันมีหลายหน้าที่ดูเหมือนกัน Google จะเลือกหน้าที่คิดว่าสมบูรณ์และมีประโยชน์มากที่สุด แล้วทำเครื่องหมายเป็นหน้า Canonical ระบบจะทำการ Crawl หน้า Canonical ให้เป็นประจำที่สุด และทำการ Crawl หน้าที่ซ้ำน้อยครั้งกว่า เพื่อลดปริมาณงานในการ Crawl เว็บไซต์ของคุณ

Google เลือกหน้า Canonical โดยพิจารณาจากปัจจัย (หรือสัญญาณ) หลายประการ เช่น หน้าเว็บแสดงผ่าน HTTP หรือ HTTPS, คุณภาพหน้าเว็บ, การแสดง URL ในแผนผังเว็บไซต์ และการติดป้ายกำกับ rel=canonical คุณระบุความต้องการให้ Google ทราบได้โดยใช้เทคนิคเหล่านี้ แต่ Google อาจเลือกหน้า Canonical คนละหน้ากับที่คุณเลือกไว้เมื่อพิจารณาเหตุผลต่างๆ แล้ว

หน้าที่เป็นเวอร์ชันภาษาต่างๆ ของหน้าหนึ่งๆ จะถือว่าซ้ำกันต่อเมื่อเนื้อหาหลักเป็นภาษาเดียวกันเท่านั้น (นั่นคือระบบจะพิจารณาว่าหน้าซ้ำเมื่อมีการแปลเฉพาะส่วนหัว ส่วนท้าย และข้อความที่ไม่สำคัญอื่นๆ แต่เนื้อหายังคงเหมือนเดิม)

Google ใช้หน้า Canonical เป็นแหล่งข้อมูลหลักในการประเมินเนื้อหาและคุณภาพ โดยปกติแล้วผลการค้นหาของ Google Search จะนำไปยังหน้า Canonical ยกเว้นกรณีที่หน้าเว็บที่ซ้ำเหมาะสมกับผู้ใช้มากกว่าอย่างชัดเจน เช่น ผลการค้นหาอาจนำไปยังหน้าสำหรับอุปกรณ์เคลื่อนที่หากผู้ใช้กำลังใช้อุปกรณ์เคลื่อนที่อยู่ แม้ว่าหน้าสำหรับเดสก์ท็อปจะมีการทำเครื่องหมายเป็นหน้า Canonical ก็ตาม

เหตุผลที่หน้าเว็บคล้ายกันหรือซ้ำกัน

มีสาเหตุหลายประการที่ทำให้เว็บไซต์อาจมี URL ต่างกันแต่นำไปยังหน้าเว็บเดียวกัน หรือ URL ต่างๆ กันมีหน้าเว็บซ้ำกันหรือคล้ายกันมาก ต่อไปนี้คือสาเหตุที่พบมากที่สุด

  • เพื่อรองรับอุปกรณ์ประเภทต่างๆ เช่น
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
  • เพื่อเปิดใช้ URL แบบไดนามิกสำหรับการทำงานต่างๆ เช่น การจัดเรียงหรือการกรองพารามิเตอร์ หรือสำหรับรหัสเซสชัน
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • หากระบบของบล็อกบันทึก URL หลายรายการโดยอัตโนมัติเมื่อคุณวางโพสต์เดียวกันในหลายๆ ส่วน
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • หากมีการกำหนดค่าเซิร์ฟเวอร์ให้แสดงเนื้อหาเดียวกันสำหรับรูปแบบ http หรือ https ที่มี www หรือไม่มี www และพอร์ตโปรโตคอล ให้ทําดังนี้
    https://example.com/green-dresses
    https://example.com/green-dresses
    https://www.example.com/green-dresses
    https://example.com:80/green-dresses
    https://example.com:443/green-dresses
  • หากเนื้อหาที่คุณมีให้ในบล็อกสำหรับการเผยแพร่ไปยังเว็บไซต์อื่นมีการทำซ้ำบางส่วนหรือทั้งหมดในโดเมนเหล่านั้น เช่น
    https://news.example.com/green-dresses-for-every-day-155672.html (โพสต์ที่เผยแพร่) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (โพสต์ต้นฉบับ)

เหตุผลที่ใช้ในการเลือก Canonical URL

มีเหตุผลหลายประการที่ควรเลือกหน้า Canonical อย่างชัดแจ้งในหน้าที่ซ้ำกันหรือคล้ายกันหลายหน้า ดังนี้

  • เพื่อระบุ URL ที่ต้องการให้ผู้ใช้เห็นในผลการค้นหา คุณอาจต้องการให้ผู้ใช้เข้าถึงหน้าผลิตภัณฑ์ชุดกระโปรงสีเขียวผ่าน https://www.example.com/dresses/green/greendress.html ไม่ใช่ https://example.com/dresses/cocktail?gclid=ABCD
  • เพื่อรวมสัญญาณลิงก์ของหน้าที่คล้ายกันหรือซ้ำกัน ซึ่งจะช่วยให้เครื่องมือค้นหารวมข้อมูลของ URL (เช่น ลิงก์ที่เชื่อมไปยังเนื้อหา) แต่ละรายการไว้ใน URL เดียวที่ต้องการได้ นั่นหมายความว่าลิงก์จากเว็บไซต์อื่นที่ชี้ไปยัง https://example.com/dresses/cocktail?gclid=ABCD จะรวมเข้ากับลิงก์ไปยัง https://www.example.com/dresses/green/greendress.html
  • เพื่อลดความซับซ้อนของเมตริกการติดตามสำหรับผลิตภัณฑ์หรือหัวข้อเดียว URL ที่หลากหลายทำให้การรวมเมตริกสำหรับเนื้อหาเฉพาะเจาะจงเป็นเรื่องยากมากขึ้น
  • เพื่อจัดการเนื้อหาที่คัดลอกมา หากคัดลอกเนื้อหาของตนเองเพื่อเผยแพร่ในโดเมนอื่นๆ คุณอาจต้องการดูให้แน่ใจว่า URL ที่ต้องการจะปรากฏในผลการค้นหา
  • เพื่อหลีกเลี่ยงการใช้เวลาในการรวบรวมข้อมูลจากหน้าที่ซ้ำกัน คุณต้องการให้ Googlebot ใช้ประโยชน์สูงสุดจากเว็บไซต์ จึงควรให้ Googlebot ใช้เวลาในการรวบรวมข้อมูลหน้าเว็บใหม่ (หรือหน้าที่อัปเดต) ในเว็บไซต์มากกว่าที่จะรวบรวมข้อมูลหน้าเว็บเดียวกันในรุ่นเดสก์ท็อปและรุ่นอุปกรณ์เคลื่อนที่

ดูว่า Google พิจารณาว่าหน้าใดเป็นหน้า Canonical

ใช้เครื่องมือตรวจสอบ URL เพื่อดูว่า Google พิจารณาว่าหน้าใดเป็นหน้า Canonical แม้คุณจะระบุหน้า Canonical ไว้อย่างชัดแจ้ง แต่ Google อาจเลือกหน้าอื่นเป็นหน้า Canonical ด้วยเหตุผลต่างๆ อย่างการพิจารณาประสิทธิภาพหรือเนื้อหา

ระบุหน้า Canonical

หากต้องการระบุ Canonical URL สำหรับ URL ที่ซ้ำกันหรือหน้าที่คล้ายกัน ให้เลือกวิธีใดวิธีหนึ่งต่อไปนี้ แม้เราจะสนับสนุนให้คุณใช้วิธีการเหล่านี้ แต่ก็ไม่ได้เป็นข้อบังคับ หากคุณไม่ได้ระบุ Canonical URL ไว้ เราจะระบุเวอร์ชันหรือ URL ที่คิดว่าดีที่สุด อย่าลืมปฏิบัติตามหลักเกณฑ์ทั่วไป

วิธีและคำอธิบาย
แท็ก rel=canonical <link>

เพิ่มแท็ก <link> ในโค้ดสำหรับหน้าที่ซ้ำกันทั้งหมดที่ชี้ไปยังหน้า Canonical

ข้อดี
  • แมปหน้าที่ซ้ำกันได้ไม่จำกัดจำนวน

ข้อเสีย

  • ขนาดของหน้าเว็บอาจเพิ่มขึ้น
  • การรักษาการแมปในเว็บไซต์ขนาดใหญ่หรือเว็บไซต์ที่มีการเปลี่ยนแปลง URL บ่อยๆ อาจซับซ้อน
  • ใช้งานได้เฉพาะกับหน้า HTML ไม่ใช่สำหรับไฟล์ เช่น PDF ในกรณีเช่นนี้คุณใช้ส่วนหัว HTTP ของ rel=canonical ได้
ส่วนหัว HTTP ของ rel=canonical

ส่งส่วนหัว rel=canonical ในการตอบกลับของหน้าเว็บ

ข้อดี

  • ขนาดหน้าไม่เพิ่มขึ้น
  • แมปหน้าที่ซ้ำกันได้ไม่จำกัดจำนวน

ข้อเสีย

  • การรักษาการแมปในเว็บไซต์ขนาดใหญ่หรือเว็บไซต์ที่มีการเปลี่ยนแปลง URL บ่อยๆ อาจซับซ้อน
แผนผังเว็บไซต์

ระบุหน้า Canonical ในแผนผังเว็บไซต์

ข้อดี

  • ดำเนินการและบำรุงรักษาได้ง่ายโดยเฉพาะอย่างยิ่งในเว็บไซต์ขนาดใหญ่

ข้อเสีย

  • Google ยังคงต้องระบุหน้าเว็บที่ซ้ำกันที่เกี่ยวข้องสำหรับหน้า Canonical ใดก็ตามที่คุณประกาศในแผนผังเว็บไซต์
  • สัญญาณที่ส่งไปยัง Google มีความสำคัญน้อยกว่าเทคนิคการแมปแบบ rel=canonical
การเปลี่ยนเส้นทาง 301 ใช้การเปลี่ยนเส้นทาง 301 เพื่อแจ้งให้ Googlebot ทราบว่า URL เปลี่ยนเส้นทางเป็นเวอร์ชันที่ดีกว่า URL ที่ระบุ ใช้ตัวเลือกนี้เฉพาะเมื่อเลิกใช้หน้าที่ซ้ำ
รูปแบบ AMP หากมีตัวแปรที่เป็นหน้า AMP ให้ทำตามหลักเกณฑ์ AMP เพื่อระบุหน้า Canonical และรูปแบบ AMP

หลักเกณฑ์ทั่วไป

สำหรับวิธีกำหนดหน้า Canonical ทั้งหมด ให้ทำตามหลักเกณฑ์ทั่วไปเหล่านี้

  • อย่าใช้ไฟล์ robots.txt ในการกำหนดหน้า Canonical
  • อย่าใช้เครื่องมือนำ URL ออกเพื่อจุดประสงค์ในการกำหนดหน้า Canonical เพราะจะเป็นการซ่อน URL ทุกเวอร์ชันจากการค้นหาของ Search
  • อย่าระบุ URL ที่ต่างกันเป็น Canonical สำหรับหน้าเว็บเดียวกันโดยใช้เทคนิคการกำหนดหน้า Canonical ที่ต่างกันหรือเหมือนกัน (เช่น อย่าระบุ URL หนึ่งในแผนผังเว็บไซต์ แต่ระบุ URL อื่นสำหรับหน้าเดียวกันนั้นโดยใช้ rel="canonical"
  • อย่าใช้ noindex เป็นวิธีป้องกันการเลือกหน้า Canonical กฎนี้มีจุดประสงค์เพื่อยกเว้นหน้าจากดัชนี ไม่ใช่เพื่อจัดการกับตัวเลือกของหน้า Canonical
  • ระบุหน้า Canonical เมื่อใช้แท็ก hreflang ระบุหน้า Canonical ที่ใช้ภาษาเดียวกัน หรือใช้ภาษาทดแทนที่ดีที่สุดหากไม่มีหน้า Canonical สำหรับภาษาเดียวกันนั้น

  • เมื่อทำการลิงก์ภายในเว็บไซต์ ให้ลิงก์ไปยัง Canonical URL แทนการลิงก์ไปยัง URL ของหน้าที่ซ้ำกัน การลิงก์ไปยัง URL ที่คุณเลือกให้เป็นหน้า Canonical อย่างสอดคล้องกันช่วยให้ Google เข้าใจสิ่งที่คุณต้องการ

ใช้ HTTPS กับ Canonical URL แทนที่จะใช้ HTTP

Google จะเลือกหน้า HTTPS เป็นหน้า Canonical แทนที่จะเลือกหน้า HTTP ที่เทียบเท่ากัน ยกเว้นในกรณีที่มีปัญหาหรือสัญญาณที่บอกถึงความขัดแย้งกัน เช่น

  • หน้า HTTPS มีใบรับรอง SSL ที่ไม่ถูกต้อง
  • หน้า HTTPS มีการขึ้นต่อกันที่ไม่ปลอดภัย (นอกเหนือจากภาพ)
  • หน้า HTTPS เปลี่ยนเส้นทางผู้ใช้ไปยังหรือผ่านหน้า HTTP
  • หน้า HTTPS มี rel="canonical" link ไปยังหน้า HTTP

แม้ว่าโดยค่าเริ่มต้น ระบบของเราจะเลือกใช้หน้า HTTPS แทนหน้า HTTP แต่จะดำเนินการต่อไปนี้เพื่อให้มั่นใจว่าเราจะเลือกใช้ HTTPS ก็ได้

  • เพิ่มการเปลี่ยนเส้นทางจากหน้า HTTP ไปยังหน้า HTTPS
  • เพิ่ม rel="canonical" link จากหน้า HTTP ไปยังหน้า HTTPS
  • ใช้ HSTS

หากต้องการป้องกันไม่ให้ Google ทำให้หน้า HTTP เป็นหน้า Canonical อย่างไม่ถูกต้อง ให้หลีกเลี่ยงการปฏิบัติดังต่อไปนี้

  • หลีกเลี่ยงการใช้ใบรับรอง TLS/SSL ที่ไม่ถูกต้องและการเปลี่ยนเส้นทาง HTTPS ไปยัง HTTP เนื่องจากจะส่งผลให้ Google เลือก HTTP เป็นหน้า Canonical ได้อย่างไม่ถูกต้อง และการนำ HSTS มาใช้ก็จะไม่ช่วยลบล้างค่ากำหนดดังกล่าว
  • หลีกเลี่ยงการรวมหน้า HTTP ไว้ในแผนผังเว็บไซต์หรือรายการ hreflang แทนที่จะรวมเวอร์ชัน HTTPS
  • หลีกเลี่ยงการใช้ใบรับรอง SSL/TLS กับรูปแบบโฮสต์ที่ไม่ตรงกัน เช่น example.com แสดงใบรับรองของ www.example.com ใบรับรองนี้ต้องระบุข้อมูลตรงกับ URL เว็บไซต์ที่สมบูรณ์ของคุณ หรือเป็นใบรับรองแบบไวลด์การ์ดที่ใช้กับโดเมนย่อยหลายรายการในโดเมนได้

แท็กลิงก์ rel=”canonical” (แท็ก Canonical) คือแท็กที่ใช้ในส่วนหัวของ HTML เพื่อระบุว่าหน้าเว็บซ้อนทับกัน หากต้องการระบุว่าหน้าใดซ้ำกับหน้าอื่น คุณสามารถใช้แท็ก <link> ในส่วน head ของ HTML

สมมติว่าคุณต้องการให้ https://example.com/dresses/green-dresses เป็น Canonical URL แม้ว่าจะมี URL หลายรายการที่เข้าถึงเนื้อหานี้ได้ก็ตาม ให้ระบุ URL นี้เป็น Canonical ตามขั้นตอนต่อไปนี้

  1. ทำเครื่องหมายหน้าเว็บที่ซ้ำกันทั้งหมดด้วยแท็กลิงก์ rel="canonical"

    เพิ่มเอลิเมนต์ <link> ที่มีแอตทริบิวต์ rel="canonical" ลงในส่วน <head> ของหน้าที่ซ้ำกันซึ่งชี้ไปยังหน้า Canonical เช่น

    <link rel="canonical" href="https://example.com/dresses/green-dresses" />
  2. หากหน้า Canonical มีรุ่นอุปกรณ์เคลื่อนที่ ให้เพิ่ม rel="alternate" link ไปยังหน้ารุ่นอุปกรณ์เคลื่อนที่ ดังนี้
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="https://m.example.com/dresses/green-dresses">
  3. เพิ่ม hreflang หรือการเปลี่ยนเส้นทางอื่นๆ ที่เหมาะสําหรับหน้านั้น

ใช้เส้นทางสมบูรณ์แทนเส้นทางสัมพัทธ์ด้วยแท็ก rel="canonical" link

ตัวอย่างที่ดี: https://www.example.com/dresses/green/greendress.html

ตัวอย่างที่ไม่ดี: /dresses/green/greendress.html

หากคุณใช้ JavaScript เพื่อเพิ่มแท็กลิงก์ rel="canonical" ตรวจสอบว่าได้แทรกแท็กลิงก์ Canonical อย่างถูกต้อง

ใช้ส่วนหัว HTTP ของ rel="canonical"

หากกำหนดค่าเซิร์ฟเวอร์ได้ คุณสามารถใช้ส่วนหัว HTTP ของ rel="canonical" (แทนที่จะใช้แท็ก HTML) เพื่อระบุ Canonical URL สำหรับเอกสารที่ Search รองรับ รวมถึงเอกสารที่ไม่ใช่ HTML เช่น ไฟล์ PDF

ขณะนี้ Google รองรับวิธีการนี้สำหรับผลการค้นหาเว็บเท่านั้น

หากคุณแสดงไฟล์ PDF ไฟล์หนึ่งใน URL หลายรายการ คุณสามารถส่งส่วนหัว HTTP ของ rel="canonical" เพื่อแจ้ง Googlebot ว่า URL ใดคือ Canonical URL สำหรับไฟล์ PDF ดังกล่าว

Link: <https://www.example.com/downloads/white-paper.pdf>; rel="canonical"

คําแนะนําสําหรับส่วนหัว HTTP ของ rel="canonical" เหมือนกับแท็ก rel="canonical" link ตาม RFC2616 ให้ใช้เครื่องหมายคำพูดคู่ในส่วนหัว HTTP ของ rel="canonical" เท่านั้น

ใช้แผนผังเว็บไซต์

เลือก Canonical URL สำหรับหน้าเว็บแต่ละหน้า และส่ง URL เหล่านั้นผ่านแผนผังเว็บไซต์ ระบบจะมองว่าหน้าเว็บทั้งหมดที่ระบุในแผนผังเว็บไซต์เป็นหน้า Canonical และ Google จะเป็นผู้ตัดสินว่าหน้าเว็บใดซ้ำกัน (ถ้ามี) โดยพิจารณาจากความคล้ายคลึงกันของเนื้อหา

เราไม่รับประกันว่าจะถือว่า URL ในแผนผังเว็บไซต์เป็น Canonical URL แต่มองเป็นวิธีที่ง่ายในการกำหนด Canonical URL สำหรับเว็บไซต์ขนาดใหญ่ และแผนผังเว็บไซต์ก็เป็นวิธีที่มีประโยชน์ในการแจ้งให้ Google ทราบถึงหน้าเว็บที่คุณมองว่าสำคัญที่สุดในเว็บไซต์ของคุณ

อย่ารวมหน้าที่ไม่ใช่หน้า Canonical ไว้ในแผนผังเว็บไซต์ หากคุณจะใช้แผนผังเว็บไซต์ ให้ระบุเฉพาะ Canonical URL ในแผนผัง

ใช้การเปลี่ยนเส้นทาง 301 สำหรับ URL ที่เลิกใช้แล้ว

ใช้วิธีการนี้เมื่อคุณต้องการกำจัดหน้าเว็บซ้ำที่มีอยู่ แต่ควรตรวจสอบว่าการเปลี่ยนผ่านไปยัง URL ใหม่ใช้ได้ก่อนที่จะเลิกใช้ URL เก่า

สมมติว่าสามารถเข้าถึงหน้าของคุณได้หลายวิธี

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

ให้เลือก URL เหล่านั้นรายการใดรายการหนึ่งเป็น Canonical URL และใช้การเปลี่ยนเส้นทาง 301 เพื่อส่งการเข้าชมจาก URL อื่นๆ ไปยัง URL ที่คุณต้องการ การเปลี่ยนเส้นทาง 301 ทางฝั่งเซิร์ฟเวอร์คือวิธีที่ดีสุดที่ช่วยให้แน่ใจว่ามีการเปลี่ยนเส้นทางผู้ใช้และเครื่องมือค้นหาไปยังหน้าที่ถูกต้อง รหัสสถานะ 301 หมายถึงหน้าเว็บได้ย้ายไปยังตำแหน่งที่ตั้งใหม่เป็นการถาวร

ถ้าคุณใช้บริการโฮสต์เว็บไซต์ ให้ค้นหาเอกสารประกอบการตั้งค่าการเปลี่ยนเส้นทาง 301 ของบริการดังกล่าว

การแก้ปัญหา

หาก Canonical URL อยู่ในพร็อพเพอร์ตี้ที่คุณไม่ได้เป็นเจ้าของ คุณจะไม่เห็นปริมาณการเข้าชมสำหรับหน้าเว็บที่ซ้ำกัน เหตุผลทั่วไปที่ทำให้ Canonical URL อาจอยู่ในพร็อพเพอร์ตี้แยกกันมีดังนี้

  • รูปแบบภาษาที่ทำเครื่องหมายไว้ไม่ถูกต้อง: หากคุณมีหลายเว็บไซต์ที่มีเนื้อหาโดยส่วนใหญ่เหมือนกันโดยแปลเป็นภาษาต่างๆ สำหรับผู้ใช้ทั่วโลก โปรดตรวจสอบว่าคุณปฏิบัติตามหลักเกณฑ์สำหรับเว็บไซต์ที่แปลเป็นภาษาท้องถิ่น
  • แท็ก Canonical ที่ไม่ถูกต้อง: ระบบจัดการเนื้อหา (CMS) บางระบบหรือปลั๊กอิน CMS อาจใช้เทคนิคการกำหนดหน้า Canonical เพื่อชี้ไปยัง URL ในเว็บไซต์ภายนอกอย่างไม่ถูกต้อง ตรวจสอบเนื้อหาของคุณเพื่อดูว่าเป็นกรณีนี้หรือไม่ หากเว็บไซต์แสดงให้เห็นการเลือก Canonical URL ที่ไม่ตรงกับที่คุณคาดไว้ ก็อาจเป็นเพราะการใช้ rel="canonical" หรือการเปลี่ยนเส้นทาง 301 อย่างไม่ถูกต้อง ให้แก้ไขปัญหานั้นโดยตรง
  • เซิร์ฟเวอร์ที่กำหนดค่าผิดพลาด: การกำหนดค่าโฮสติ้งบางอย่างที่ไม่ถูกต้องอาจเป็นสาเหตุให้เกิดการเลือก URL ข้ามโดเมนที่ไม่ตรงกับที่คาดไว้ เช่น
    • เซิร์ฟเวอร์อาจมีการกำหนดค่าผิดพลาดให้แสดงเนื้อหาจาก a.com เพื่อตอบสนองต่อคำขอ URL ใน b.com
    • เว็บเซิร์ฟเวอร์ 2 รายการที่ไม่เกี่ยวข้องกันอาจจะแสดงผลหน้า soft 404 ที่เหมือนกันซึ่ง Google ระบุไม่ได้ว่าเป็นหน้าข้อผิดพลาด
  • การแฮ็กที่ประสงค์ร้าย: การโจมตีเว็บไซต์บางครั้งทำให้เกิดโค้ดที่แสดงการเปลี่ยนเส้นทาง 301 ของ HTTP หรือแทรกแท็กลิงก์ rel="canonical" แบบข้ามโดเมนเข้าไปใน <head> แบบ HTML หรือส่วนหัว HTTP ซึ่งโดยปกติจะชี้ไปยัง URL ที่โฮสต์เนื้อหาที่เป็นอันตรายหรือเป็นสแปม ในกรณีเหล่านี้ อัลกอริทึมของเราอาจเลือก URL ที่เป็นอันตรายหรือที่เป็นสแปมแทนที่จะเป็น URL ในเว็บไซต์ที่ถูกบุกรุก
  • เว็บไซต์เลียนแบบ: ในบางสถานการณ์ซึ่งพบได้น้อย อัลกอริทึมของเราอาจเลือก URL จากเว็บไซต์ภายนอกที่โฮสต์เนื้อหาโดยไม่ได้รับอนุญาตจากคุณ หากเชื่อว่าเว็บไซต์อื่นกำลังทำซ้ำเนื้อหาของคุณซึ่งเป็นการละเมิดกฎหมายลิขสิทธิ์ คุณสามารถติดต่อโฮสต์ของเว็บไซต์เพื่อขอให้นำเนื้อหาออก นอกจากนี้ คุณขอให้ Google นำหน้าที่ละเมิดออกจากผลการค้นหาได้โดยยื่นคำขอภายใต้ Digital Millennium Copyright Act