สร้างและส่งแผนผังเว็บไซต์

หน้านี้จะอธิบายวิธีสร้างแผนผังเว็บไซต์และทำให้ใช้งานกับ Google ได้ ดูข้อมูลเพิ่มเติมเกี่ยวกับแผนผังเว็บไซต์

  1. เลือกหน้าในเว็บไซต์ที่ควรให้ Google รวบรวมข้อมูล และกำหนดเวอร์ชัน Canonical ของแต่ละหน้า
  2. เลือกรูปแบบแผนผังเว็บไซต์ที่คุณต้องการใช้ คุณสร้างแผนผังเว็บไซต์ได้ด้วยตนเองหรือจะเลือกจากเครื่องมือของบุคคลที่สามซึ่งมีอยู่หลายรายการเพื่อสร้างแผนผังเว็บไซต์ก็ได้
  3. ทำให้แผนผังเว็บไซต์พร้อมใช้งานสำหรับ Google โดยเพิ่มไปยังไฟล์ robots.txt หรือส่งไปที่ Search Console โดยตรง

รูปแบบแผนผังเว็บไซต์

Google รองรับแผนผังเว็บไซต์รูปแบบต่างๆ ตามที่อธิบายไว้ที่นี่ และทุกรูปแบบควรมีโปรโตคอลแผนผังเว็บไซต์มาตรฐาน ปัจจุบัน Google ไม่ได้ใช้แอตทริบิวต์ <priority> ในแผนผังเว็บไซต์

ทุกรูปแบบจะจำกัดขนาดแผนผังเว็บไซต์เดี่ยวอยู่ที่ 50 MB (ไม่บีบอัด) และ URL 50,000 รายการ หากมีไฟล์ขนาดใหญ่กว่านี้หรือมี URL มากกว่านี้ จะต้องแยกแผนผังเว็บไซต์ออกเป็นหลายๆ รายการ คุณสร้างไฟล์ดัชนีแผนผังเว็บไซต์ (ไฟล์ที่ชี้ไปยังรายการแผนผังเว็บไซต์) และส่งไฟล์ดัชนีไฟล์เดียวนั้นไปยัง Google ได้หากต้องการ หรือจะส่งแผนผังเว็บไซต์หลายรายการและ/หรือไฟล์ดัชนีแผนผังเว็บไซต์หลายไฟล์ไปยัง Google ก็ได้

XML

ต่อไปนี้คือแผนผังเว็บไซต์ XML พื้นฐานที่สุดที่มีตำแหน่งของ URL เดี่ยว

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.example.com/foo.html</loc>
   <lastmod>2018-06-04</lastmod>
  </url>
</urlset>

ดูตัวอย่างที่ซับซ้อนมากขึ้นและเอกสารประกอบฉบับเต็มได้ที่ sitemaps.org

ดูตัวอย่างแผนผังเว็บไซต์ที่ระบุหน้าภาษาอื่นและแผนผังเว็บไซต์สำหรับไฟล์ข่าว รูปภาพ หรือวิดีโอได้

RSS, mRSS และ Atom 1.0

หากมีบล็อกที่มีฟีด RSS หรือ Atom ก็ส่ง URL ของฟีดเป็นแผนผังเว็บไซต์ได้ ซอฟต์แวร์บล็อกส่วนใหญ่สร้างฟีดให้คุณได้ แต่โปรดทราบว่าฟีดนี้ให้ข้อมูลเกี่ยวกับ URL ล่าสุดเท่านั้น

  • Google รับฟีด RSS 2.0 และ Atom 1.0
  • คุณใช้ฟีด mRSS (media RSS) เพื่อส่งรายละเอียดเกี่ยวกับเนื้อหาวิดีโอในเว็บไซต์ให้ Google ได้

ข้อความ

หากแผนผังเว็บไซต์มีเฉพาะ URL ของหน้าเว็บ คุณส่งไฟล์ข้อความธรรมดาที่มี 1 URL ต่อบรรทัดให้ Google ได้ เช่น

http://www.example.com/file1.html
http://www.example.com/file2.html

หลักเกณฑ์สำหรับแผนผังเว็บไซต์แบบไฟล์ข้อความมีดังนี้

  • เข้ารหัสไฟล์โดยใช้การเข้ารหัส UTF-8
  • ไฟล์ข้อความไม่ควรมีอย่างอื่นนอกจากรายการ URL
  • คุณจะตั้งชื่อไฟล์ข้อความว่าอะไรก็ได้ ตราบใดที่ไฟล์นั้นมีนามสกุล .txt (เช่น sitemap.txt)

Google Sites

หากคุณใช้ Google Sites เพื่อสร้างและยืนยันเว็บไซต์ Google Sites จะสร้างแผนผังเว็บไซต์ให้คุณโดยอัตโนมัติ คุณจะแก้ไขแผนผังเว็บไซต์นี้ไม่ได้ แต่ส่งแผนผังเว็บไซต์ไปยัง Google ได้ ในกรณีที่ต้องการอ่านข้อมูลรายงานของแผนผังเว็บไซต์ โปรดทราบว่าแผนผังเว็บไซต์อาจแสดงไม่ถูกต้องหากมีหน้ามากกว่า 1,000 หน้าในไดเรกทอรีย่อยเดียว

  • URL ของแผนผังเว็บไซต์จะเป็น http://sites.google.com/site/yoursitename/system/feeds/sitemap หากเว็บไซต์โฮสต์อยู่ที่ Google Sites
  • URL ของแผนผังเว็บไซต์จะเป็น https://sites.google.com/yourdomain/yoursitename/system/feeds/sitemap หากคุณสร้างเว็บไซต์โดยใช้ Google Workspace

ส่วนขยายแผนผังเว็บไซต์สำหรับสื่อประเภทอื่นๆ

Google รองรับไวยากรณ์แผนผังเว็บไซต์เพิ่มเติมสำหรับสื่อประเภทต่อไปนี้ โปรดใช้ส่วนขยายเหล่านี้เพื่ออธิบายไฟล์วิดีโอ รูปภาพ และเนื้อหาอื่นๆ ที่ยากต่อการแยกวิเคราะห์ในเว็บไซต์ของคุณเพื่อปรับปรุงการจัดทำดัชนี

หลักเกณฑ์ทั่วไปสำหรับแผนผังเว็บไซต์

  • ใช้ URL ที่สอดคล้องกันและอยู่ในรูปแบบเต็ม Google จะรวบรวมข้อมูลจาก URL ตรงตามที่ระบุทุกประการ ตัวอย่างเช่น หากเว็บไซต์อยู่ที่ https://www.example.com/ อย่าระบุ URL เป็น https://example.com/ (ไม่มี www) หรือ ./mypage.html (URL แบบสัมพัทธ์)
  • คุณโพสต์แผนผังเว็บไซต์ที่ตำแหน่งใดก็ได้ในเว็บไซต์ แต่แผนผังเว็บไซต์จะมีผลเฉพาะกับไดเรกทอรีที่สืบทอดจากไดเรกทอรีระดับบนสุด ดังนั้น แผนผังเว็บไซต์ที่โพสต์ไว้ที่รูทของเว็บไซต์ซึ่งเป็นตำแหน่งที่เราแนะนำให้โพสต์แผนผังเว็บไซต์นั้นจะมีผลกับทุกไฟล์ในเว็บไซต์
  • อย่ารวมรหัสเซสชันจาก URL ในแผนผังเว็บไซต์เพื่อลดการรวบรวมข้อมูล URL เหล่านั้นซ้ำ
  • แจ้งให้ Google ทราบเกี่ยวกับเวอร์ชันภาษาทางเลือกของ URL โดยใช้ข้อมูลเสริม hreflang
  • ไฟล์แผนผังเว็บไซต์ต้องมีการเข้ารหัส UTF-8 และใช้อักขระหลีกกับ URL อย่างเหมาะสม
  • แยกแผนผังเว็บไซต์ขนาดใหญ่เป็นแผนผังเว็บไซต์ขนาดเล็ก โดยขนาดของแผนผังเว็บไซต์สูงสุดคือ URL 50,000 รายการ/50 MB เมื่อไม่ได้บีบอัด ใช้ไฟล์ดัชนีแผนผังเว็บไซต์เพื่อแสดงแผนผังเว็บไซต์ทั้งหมดและส่งไฟล์เดี่ยวนี้ไปยัง Google แทนการส่งแผนผังเว็บไซต์แต่ละรายการ
  • แสดงเฉพาะ Canonical URL ในแผนผังเว็บไซต์ หากคุณมีหน้าเว็บ 2 เวอร์ชัน ให้แสดงเฉพาะหน้า Canonical (ที่ Google เลือก) ในแผนผังเว็บไซต์ หากคุณมีเว็บไซต์ 2 เวอร์ชัน (เช่น มี www และไม่มี www) ให้ตัดสินใจว่าจะใช้เว็บไซต์ใดเป็นหลัก แล้วใส่แผนผังเว็บไซต์ไว้ที่เว็บไซต์นั้น และเพิ่ม rel=canonical หรือการเปลี่ยนเส้นทางไว้ในอีกเว็บไซต์หนึ่ง
  • หากคุณมี URL ที่ต่างกันสำหรับหน้าเว็บรุ่นอุปกรณ์เคลื่อนที่และรุ่นเดสก์ท็อป ขอแนะนำให้ชี้ไปที่เวอร์ชันเดียวเท่านั้นในแผนผังเว็บไซต์ แต่หากคิดว่าจำเป็นต้องชี้ไปที่ URL ทั้งคู่ ให้ใส่ข้อมูลเสริมใน URL เพื่อระบุว่าเป็นรุ่นเดสก์ท็อปและรุ่นอุปกรณ์เคลื่อนที่
  • ใช้ส่วนขยายแผนผังเว็บไซต์เพื่อชี้ไปที่สื่อประเภทอื่นๆ เช่น วิดีโอ รูปภาพ และข่าว
  • หากมีหน้าเว็บทางเลือกสำหรับภาษาหรือภูมิภาคอื่น คุณจะใช้ hreflang ในแผนผังเว็บไซต์หรือแท็ก html เพื่อระบุ URL ทางเลือกได้
  • อักขระที่ไม่ใช่ตัวอักษรผสมตัวเลขและตัวอักษรละติน เรากำหนดให้ไฟล์แผนผังเว็บไซต์ต้องเข้ารหัสแบบ UTF-8 (โดยทั่วไปคุณจะทำได้เมื่อบันทึกไฟล์) และเช่นเดียวกับไฟล์ XML ทั้งหมด ค่าของข้อมูลทุกค่า (รวมทั้ง URL) ต้องใช้อักขระหลีกสำหรับอักขระที่แสดงในตารางด้านล่างนี้ แผนผังเว็บไซต์มีได้เฉพาะอักขระ ASCII เท่านั้น ต้องไม่มีอักขระ ASCII ตัวพิมพ์ใหญ่ หรือรหัสควบคุมบางรหัส หรือสัญลักษณ์พิเศษ เช่น * และ {} หาก URL ของแผนผังเว็บไซต์มีอักขระเหล่านี้ คุณจะได้รับข้อผิดพลาดเมื่อพยายามเพิ่ม URL
    อักขระ อักขระหลีก
    เครื่องหมาย & & &amp;
    เครื่องหมายคำพูดเดี่ยว ' &apos;
    เครื่องหมายคำพูดคู่ " &quot;
    เครื่องหมายมากกว่า > &gt;
    เครื่องหมายน้อยกว่า < &lt;
    นอกจากนี้ URL ทั้งหมด (รวมถึง URL ของแผนผังเว็บไซต์) ต้องมีการเข้ารหัสเพื่อให้เว็บเซิร์ฟเวอร์ที่ โฮสต์ URL นั้นและใช้อักขระหลีกกับ URL สามารถอ่านได้ อย่างไรก็ตาม หากคุณใช้สคริปต์ เครื่องมือ หรือไฟล์บันทึกประเภทใดก็ตามเพื่อสร้าง URL (ทุกสิ่งยกเว้นการพิมพ์ URL เองด้วยมือ) จะมีการเข้ารหัสดังกล่าวให้อยู่แล้ว หากคุณส่งแผนผังเว็บไซต์และมีข้อผิดพลาดแสดงขึ้นว่า Google ไม่พบ URL บางรายการ โปรดตรวจสอบว่า URL เป็นไปตามมาตรฐาน RFC-3986 สำหรับ URI, มาตรฐาน RFC-3987 สำหรับ IRI และมาตรฐาน XML

    ต่อไปนี้คือตัวอย่าง URL ที่ใช้อักขระที่ไม่ใช่ ASCII (ü) และอักขระที่ต้องใช้อักขระหลีก (&):
    http://www.example.com/ümlat.html&q=name
    ต่อไปนี้เป็น URL เดียวกันซึ่งมีการเข้ารหัส ISO-8859-1 (สำหรับการโฮสต์บนเซิร์ฟเวอร์ที่ใช้การเข้ารหัสนั้น) และใช้อักขระหลีกกับ URL
    http://www.example.com/%FCmlat.html&q=name
    ต่อไปนี้เป็น URL เดียวกันซึ่งมีการเข้ารหัส UTF-8 (สำหรับการโฮสต์บนเซิร์ฟเวอร์ที่ใช้การเข้ารหัสนั้น) และใช้อักขระหลีกกับ URL
    http://www.example.com/%C3%BCmlat.html&q=name
    ต่อไปนี้เป็น URL เดียวกันซึ่งใช้อักขระหลีก
    http://www.example.com/%C3%BCmlat.html&amp;q=name
  • โปรดทราบว่าแผนผังเว็บไซต์เป็นคำแนะนำให้ Google ทราบถึงหน้าเว็บที่คุณคิดว่าสำคัญ Google ไม่ได้รับประกันว่าจะรวบรวมข้อมูลทุก URL ในแผนผังเว็บไซต์
  • Google ไม่สนใจค่า <priority> และ <changefreq> จึงไม่จำเป็นต้องเพิ่มค่าเหล่านั้น
  • Google จะอ่านค่า <lastmod> แต่ถ้าคุณแสดงค่านี้ผิด เราจะหยุดอ่านค่านั้น
  • ตำแหน่งของ URL ในแผนผังเว็บไซต์ไม่สำคัญ เนื่องจาก Google จะไม่รวบรวมข้อมูล URL ตามลำดับที่ปรากฏในแผนผังเว็บไซต์

ทำให้แผนผังเว็บไซต์พร้อมใช้งานสำหรับ Google (ส่งแผนผังเว็บไซต์ไปยัง Google)

Google ไม่ได้ตรวจสอบแผนผังเว็บไซต์ทุกครั้งที่มีการเข้ารวบรวมข้อมูล โดยจะตรวจสอบเฉพาะครั้งแรกที่เราเห็น และจะมีการตรวจสอบอีกหลังจากนั้นก็ต่อเมื่อคุณใช้คำสั่ง ping เพื่อแจ้งให้เราทราบว่ามีการเปลี่ยนแปลง คุณควรแจ้ง Google เกี่ยวกับแผนผังเว็บไซต์เฉพาะเมื่อเป็นแผนผังใหม่หรือเมื่อมีการอัปเดต อย่าส่งหรือใช้คำสั่ง ping แผนผังเว็บไซต์ที่ไม่มีการเปลี่ยนแปลงหลายครั้ง

การทำให้แผนผังเว็บไซต์พร้อมใช้งานสำหรับ Google มีหลายวิธีดังนี้

  • ส่งไปยัง Google โดยใช้เครื่องมือแผนผังเว็บไซต์ของ Search Console
  • ใส่บรรทัดต่อไปนี้ไว้ที่ใดก็ได้ในไฟล์ robots.txt โดยระบุเส้นทางไปยังแผนผังเว็บไซต์
    Sitemap: http://example.com/sitemap_location.xml
  • ใช้ฟังก์ชัน "ping" เพื่อขอให้เรารวบรวมข้อมูลแผนผังเว็บไซต์ ส่งคำขอ HTTP GET ลักษณะนี้
    http://www.google.com/ping?sitemap=<complete_url_of_sitemap>
    ตัวอย่างเช่น
    http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

การแก้ปัญหาแผนผังเว็บไซต์

ดูคำแนะนำในการแก้ปัญหาแผนผังเว็บไซต์