การกำหนดหน้า Canonical คืออะไร

การกำหนดหน้า Canonical คือขั้นตอนการเลือก Canonical URL ที่เป็นตัวแทนของเนื้อหาชิ้นหนึ่งๆ Canonical URL จึงเป็น URL ของหน้าที่ Google เลือกว่าเป็นตัวแทนที่ดีที่สุดจากชุดหน้าที่ซ้ำกัน ขั้นตอนนี้มักเรียกว่าการกรองข้อมูลที่ซ้ำกันออก เนื่องจากกระบวนการนี้จะช่วยให้ Google แสดงเนื้อหาที่ซ้ำกันเพียงเวอร์ชันเดียวในผลการค้นหา

มีหลายสาเหตุที่เว็บไซต์อาจมีเนื้อหาที่ซ้ำกัน ดังนี้

  • รูปแบบของภูมิภาค: กล่าวคือเนื้อหาสำหรับสหรัฐอเมริกาและสหราชอาณาจักรซึ่งเข้าถึงได้จากคนละ URL แต่มีเนื้อหาเดียวกันในภาษาเดียวกัน
  • รูปแบบของอุปกรณ์: เช่น หน้าเว็บที่มีทั้งเวอร์ชันอุปกรณ์เคลื่อนที่และเวอร์ชันเดสก์ท็อป
  • รูปแบบของโปรโตคอล: เช่น เวอร์ชัน HTTP และ HTTPS ของเว็บไซต์
  • ฟังก์ชันของเว็บไซต์: เช่น ผลลัพธ์ของการจัดเรียงและการกรองหน้าหมวดหมู่
  • รูปแบบที่ไม่ตั้งใจ: เช่น เว็บไซต์เวอร์ชันสาธิตอาจปล่อยให้ Crawler เข้าถึงโดยไม่ตั้งใจ

การมีเนื้อหาที่ซ้ำกันบ้างในเว็บไซต์นั้นเป็นเรื่องปกติ และไม่เป็นการละเมิดนโยบายสแปมของ Google อย่างไรก็ตาม การมีเนื้อหาเดียวกันที่เข้าถึงได้ผ่าน URL ที่ต่างกันหลาย URL อาจทำให้ผู้ใช้ได้รับประสบการณ์ที่ไม่ดี (เช่น ผู้ใช้อาจสงสัยว่าหน้าใดถูกต้อง และเนื้อหาทั้งสองแตกต่างกันหรือไม่) อาจทำให้คุณติดตามประสิทธิภาพของเนื้อหาในผลการค้นหาได้ยากขึ้น

วิธีที่ Google จัดทำดัชนีและเลือก Canonical URL

เมื่อ Google จัดทำดัชนีหน้าเว็บ ระบบจะกำหนดเนื้อหาหลัก (หรือกึ่งกลาง) ของแต่ละหน้า หาก Google พบหน้าเว็บหลายหน้าที่ดูเหมือนกัน หรือมีเนื้อหาหลักที่คล้ายกันอย่างมาก Google จะเลือกหน้าตามปัจจัยในการจัดทําดัชนี (หรือสัญญาณ) ที่รวบรวมได้ ซึ่งเป็นหน้าที่สมบูรณ์และมีประโยชน์ตามวัตถุประสงค์มากที่สุดสําหรับผู้ใช้ Search และจะทําเครื่องหมายว่าเป็นหน้า Canonical ระบบจะทำการ Crawl หน้า Canonical ให้เป็นประจำที่สุด และทำการ Crawl หน้าที่ซ้ำน้อยครั้งกว่า เพื่อลดปริมาณงานในการ Crawl เว็บไซต์ของคุณ

มีปัจจัยอยู่จำนวนหนึ่งที่มีบทบาทในการกําหนดหน้า Canonical เช่น หน้าเว็บแสดงผ่าน HTTP หรือ HTTPS, การเปลี่ยนเส้นทาง, การแสดง URL ใน Sitemap และคำอธิบายประกอบของ rel="canonical" link คุณระบุความต้องการให้ Google ทราบได้โดยใช้เทคนิคเหล่านี้ แต่ Google อาจเลือกหน้า Canonical คนละหน้ากับที่คุณเลือกไว้เมื่อพิจารณาเหตุผลต่างๆ แล้ว กล่าวคือ การระบุ Canonical ที่ต้องการเป็นเพียงคำให้สัญญาณ ไม่ใช่กฎ

หน้าที่เป็นเวอร์ชันภาษาต่างๆ ของหน้าหนึ่งๆ จะถือว่าซ้ำกันต่อเมื่อเนื้อหาหลักเป็นภาษาเดียวกันเท่านั้น (นั่นคือระบบจะพิจารณาว่าหน้าซ้ำเมื่อมีการแปลเฉพาะส่วนหัว ส่วนท้าย และข้อความที่ไม่สำคัญอื่นๆ แต่เนื้อหายังคงเหมือนเดิม) หากต้องการดูข้อมูลเพิ่มเติมเกี่ยวกับการตั้งค่าเว็บไซต์ที่แปลแล้ว โปรดดูเอกสารประกอบเกี่ยวกับการจัดการเว็บไซต์หลายภาษาและหลายภูมิภาค

Google ใช้หน้า Canonical เป็นแหล่งข้อมูลหลักในการประเมินเนื้อหาและคุณภาพ โดยปกติแล้วผลการค้นหาของ Google Search จะนำไปยังหน้า Canonical ยกเว้นกรณีที่หน้าเว็บที่ซ้ำเหมาะสมกับผู้ค้นหามากกว่าอย่างชัดเจน เช่น ผลการค้นหาอาจนำไปยังหน้าสำหรับอุปกรณ์เคลื่อนที่หากผู้ใช้กำลังใช้อุปกรณ์เคลื่อนที่อยู่ แม้ว่าหน้าเว็บบนเดสก์ท็อปจะมีการทำเครื่องหมายเป็นหน้า Canonical ก็ตาม

อ่านเพิ่มเติมเกี่ยวกับวิธีระบุ Canonical URL ที่ต้องการและดูว่าคุณต้องระบุหรือไม่