หลีกเลี่ยงการสร้างเนื้อหาที่ซ้ำกัน

โดยทั่วไปเนื้อหาที่ซ้ำกันหมายถึงกลุ่มเนื้อหาปริมาณมากภายในโดเมนหรือข้ามโดเมน ซึ่งตรงกับเนื้อหาอื่นในภาษาเดียวกันทุกประการหรือเห็นได้ว่าคล้ายคลึงกัน โดยส่วนใหญ่จะไม่ใช่การทำขึ้นเพื่อหลอกลวง ตัวอย่างของเนื้อหาที่ซ้ำกันที่ไม่ประสงค์ร้ายอาจรวมถึง

  • ฟอรัมสนทนาที่อาจสร้างหน้าเว็บทั้งแบบปกติและแบบตัดทอนรายละเอียดสำหรับอุปกรณ์เคลื่อนที่
  • สินค้าในร้านค้าออนไลน์ที่แสดงหรือลิงก์กับ URL ที่ต่างกันหลายรายการ
  • หน้าเว็บในเวอร์ชันสำหรับพิมพ์เท่านั้น

หากเว็บไซต์ของคุณมีหน้าเว็บหลายหน้าที่มีเนื้อหาเหมือนกันเป็นส่วนใหญ่ คุณสามารถระบุ URL ที่ต้องการให้ Google ได้หลายวิธี (เรียกว่า "การกำหนดหน้า Canonical") ข้อมูลเพิ่มเติมเกี่ยวกับการกำหนดหน้า Canonical

อย่างไรก็ตาม ในบางกรณี เนื้อหาอาจถูกทำซ้ำทั่วทั้งโดเมนอย่างตั้งใจ เพื่อพยายามบิดเบือนการจัดอันดับของเครื่องมือค้นหาหรือให้ได้มาซึ่งอัตราการเข้าชมที่เพิ่มขึ้น การกระทำที่หลอกลวงเช่นนี้อาจทำให้ผู้ใช้มีประสบการณ์การใช้งานที่ไม่ดี เมื่อผู้เข้าชมพบเนื้อหาเดียวกันซ้ำๆ กันอยู่เรื่อยๆ ในผลการค้นหาชุดหนึ่ง

Google มุ่งมั่นที่จะจัดทำดัชนีและแสดงหน้าเว็บที่มีข้อมูลที่แตกต่างกันอย่างชัดเจน ตัวอย่างเช่น ตัวกรองนี้หมายถึง หากเว็บไซต์ของคุณมีบทความเวอร์ชัน "ปกติ" และ "สำหรับพิมพ์" และไม่มีการบล็อกเวอร์ชันใดๆ ด้วยแท็ก noindex เราจะเลือกมาแสดงเวอร์ชันเดียว ในกรณีที่ไม่ค่อยพบซึ่ง Google พิจารณาว่าเนื้อหาที่ซ้ำกันนั้นอาจแสดงขึ้นมาโดยมีเจตนาบิดเบือนการจัดอันดับของเราและหลอกลวงผู้ใช้ เราจะทำการแก้ไขที่เหมาะสมในการจัดทำดัชนีและการจัดอันดับเว็บไซต์ที่เกี่ยวข้องด้วย ดังนั้น การจัดอันดับของเว็บไซต์นั้นอาจได้รับผลกระทบ หรือเราอาจนำเว็บไซต์ออกจากดัชนีของ Google ไปเลย ซึ่งในกรณีเช่นนี้เว็บไซต์นั้นจะไม่ปรากฏในผลการค้นหาอีกต่อไป

วิธีการต่อไปนี้จะช่วยจัดการปัญหาเนื้อหาที่ทำซ้ำ เพื่อให้ผู้เข้าชมพบเนื้อหาที่คุณต้องการให้เห็น

  • ใช้ 301: หากคุณจัดโครงสร้างเว็บไซต์ใหม่ ให้ใช้การเปลี่ยนเส้นทาง 301 ("RedirectPermanent") ในไฟล์ .htaccess เพื่อเปลี่ยนเส้นทางองผู้ใช้, Googlebot และสไปเดอร์อื่นๆ อย่างแยบยล (ใน Apache ดำเนินการได้ด้วยไฟล์ .htaccess ส่วนใน IIS ให้ใช้คอนโซลดูแลระบบ)
  • ใช้ลิงก์เดียวกัน: พยายามใช้การลิงก์ภายในให้ตรงกัน เช่น อย่าลิงก์ไปที่ http://www.example.com/page/ และ http://www.example.com/page และ http://www.example.com/page/index.htm
  • ใช้โดเมนระดับบนสุด: หากเป็นไปได้ โปรดใช้โดเมนระดับบนสุดในการจัดการเนื้อหาที่เจาะจงประเทศ เราจะได้แสดงเอกสารในเวอร์ชันที่เหมาะสมที่สุดกับประเทศนั้นๆ ตัวอย่างเช่น เรามีแนวโน้มที่จะทราบว่า http://www.example.de มีเนื้อหาที่เน้นสำหรับประเทศเยอรมนีมากกว่า http://www.example.com/de หรือ http://de.example.com
  • เผยแพร่อย่างระมัดระวัง: หากคุณเผยแพร่เนื้อหาในเว็บไซต์อื่นๆ Google มักจะแสดงเวอร์ชันที่เราคิดว่าเหมาะสำหรับผู้ใช้มากที่สุดในการค้นหาแต่ละครั้ง ซึ่งอาจใช่หรือไม่ใช่เวอร์ชันที่คุณต้องการก็ได้ อย่างไรก็ตาม คุณควรตรวจสอบว่าเว็บไซต์แต่ละแห่งที่คุณเผยแพร่เนื้อหานั้นมีลิงก์กลับไปยังบทความต้นฉบับของคุณ และยังขอให้ผู้ที่ใช้เนื้อหาที่คุณเผยแพร่นั้นใช้เมตาแท็ก noindex เพื่อป้องกันไม่ให้เครื่องมือค้นหาจัดทำดัชนีเนื้อหาในเวอร์ชันของผู้ใช้เหล่านั้นได้อีกด้วย
  • ลดข้อความสำเร็จรูปที่ซ้ำกัน: เช่น แทนที่จะใส่ข้อความแสดงลิขสิทธิ์ที่ยาวๆ ไว้ท้ายหน้าทุกหน้า ให้ใส่ข้อความสรุปสั้นๆ แล้วลิงก์ไปยังหน้าที่มีรายละเอียดเพิ่มเติม นอกจากนี้คุณอาจใช้เครื่องมือจัดการพารามิเตอร์เพื่อกำหนดวิธีที่คุณต้องการให้ Google ปฏิบัติต่อพารามิเตอร์ของ URL
  • หลีกเลี่ยงการเผยแพร่ตัวยึดตำแหน่ง: ผู้ใช้ไม่ต้องการเห็นหน้า "ว่าง" จึงควรหลีกเลี่ยงตัวยึดตำแหน่งหากเป็นไปได้ ตัวอย่างเช่น อย่าเผยแพร่หน้าเว็บที่ยังไม่มีเนื้อหาจริงๆ อยู่ในหน้า หากต้องการสร้างหน้าตัวยึดตำแหน่ง ให้ใช้แท็ก noindex เพื่อบล็อกไม่ให้มีการจัดทำดัชนีหน้าเหล่านี้
  • ทำความเข้าใจระบบจัดการเนื้อหา: ศึกษาวิธีแสดงเนื้อหาบนเว็บไซต์ของคุณ บล็อก ฟอรัม และระบบที่เกี่ยวข้องมักแสดงเนื้อหาเดียวกันในรูปแบบต่างๆ เช่น รายการในบล็อกอาจปรากฏในหน้าแรกของบล็อก ในหน้าที่เก็บถาวร และในหน้ารายการอื่นๆ ที่มีป้ายกำกับเดียวกัน
  • ลดเนื้อหาที่คล้ายกัน: หากมีหน้าที่คล้ายกันหลายหน้า อาจเพิ่มเนื้อหาในแต่ละหน้า หรือรวมข้อมูลเหล่านั้นไว้ในหน้าเดียว ตัวอย่างเช่น หากมีเว็บไซต์ท่องเที่ยวที่มีหน้าเว็บแยกต่างหากสำหรับเมือง 2 เมือง แต่ทั้ง 2 หน้านั้นมีข้อมูลเดียวกัน ก็อาจรวมทั้ง 2 หน้าให้เป็นหน้าเดียวเกี่ยวกับทั้ง 2 เมือง หรืออาจเพิ่มเนื้อหาของแต่ละเมืองเพื่อให้ข้อมูลต่างกัน

Google ไม่แนะนำให้บล็อกการเข้าถึงของโปรแกรมรวบรวมข้อมูลไปยังเนื้อหาที่ซ้ำกันบนเว็บไซต์ ไม่ว่าจะด้วยไฟล์ robots.txt หรือวิธีอื่นๆ หากเครื่องมือค้นหารวบรวมข้อมูลหน้าที่มีเนื้อหาซ้ำกันไม่ได้ ก็จะไม่พบโดยอัตโนมัติว่า URL เหล่านี้ชี้ไปที่เนื้อหาเดียวกัน จึงถือว่าหน้าเหล่านั้นเป็นหน้าที่ไม่ซ้ำกัน วิธีแก้ปัญหาที่ดีคืออนุญาตให้เครื่องมือค้นหารวบรวมข้อมูล URL ดังกล่าว แต่ทำเครื่องหมายว่าซ้ำกันโดยใช้เอลิเมนต์ของลิงก์ rel="canonical" ซึ่งเป็นเครื่องมือจัดการพารามิเตอร์ของ URL หรือการเปลี่ยนเส้นทาง 301 ในกรณีที่เนื้อหาที่ซ้ำกันทำให้เรารวบรวมข้อมูลเว็บไซต์มากเกินไป คุณจะปรับการตั้งค่าอัตราการรวบรวมข้อมูลใน Search Console ได้ด้วย

เนื้อหาที่ซ้ำกันในเว็บไซต์ไม่ใช่สาเหตุที่ทำให้เราดำเนินการกับเว็บไซต์นั้น เว้นแต่เราจะเห็นว่าเนื้อหาที่ซ้ำกันนั้นมีเจตนาหลอกลวงและบิดเบือนผลลัพธ์ของเครื่องมือค้นหา หากเว็บไซต์ได้รับผลกระทบจากปัญหาเนื้อหาที่ซ้ำกันและคุณไม่ดำเนินการตามคำแนะนำที่ระบุไว้ในเอกสารนี้ เราจะเลือกเวอร์ชันของเนื้อหาที่จะแสดงในผลการค้นหาของเราให้เอง

อย่างไรก็ตาม หากตรวจสอบแล้วพบว่าคุณมีส่วนในการกระทำที่หลอกลวงและมีการนำเว็บไซต์ของคุณออกจากผลการค้นหาไปแล้ว โปรดตรวจสอบเว็บไซต์ของคุณอย่างละเอียด หากระบบนำเว็บไซต์ของคุณออกจากผลการค้นหาไปแล้ว โปรดอ่านหลักเกณฑ์สำหรับผู้ดูแลเว็บสำหรับข้อมูลเพิ่มเติม เมื่อคุณทำการเปลี่ยนแปลงและมั่นใจแล้วว่าเว็บไซต์ไม่ละเมิดหลักเกณฑ์ ให้ส่งเว็บไซต์เพื่อขอให้พิจารณาใหม่

ในบางสถานการณ์ซึ่งพบได้ไม่บ่อยนัก อัลกอริทึมของเราอาจเลือก URL จากเว็บไซต์ภายนอกที่โฮสต์เนื้อหาโดยไม่ได้รับอนุญาตจากคุณ หากเชื่อว่าเว็บไซต์อื่นกำลังทำซ้ำเนื้อหาของคุณซึ่งเป็นการละเมิดกฎหมายลิขสิทธิ์ คุณอาจติดต่อโฮสต์ของเว็บไซต์เพื่อขอให้นำออกได้ นอกจากนี้ คุณขอให้ Google นำหน้าที่ละเมิดออกจากผลการค้นหาของเราได้โดยยื่นคำขอภายใต้ Digital Millennium Copyright Act