สร้างและส่งแผนผังเว็บไซต์

หน้านี้จะอธิบายวิธีสร้างแผนผังเว็บไซต์และทำให้ใช้งานกับ Google ได้ ดูข้อมูลเพิ่มเติมเกี่ยวกับแผนผังเว็บไซต์ที่นี่

  1. เลือกรูปแบบแผนผังเว็บไซต์ที่คุณต้องการใช้
  2. สร้างแผนผังเว็บไซต์โดยอัตโนมัติหรือด้วยตัวเอง
  3. ทำให้แผนผังเว็บไซต์พร้อมใช้งานสำหรับ Google โดยเพิ่มไปยังไฟล์ robots.txt หรือส่งไปที่ Search Console โดยตรง

รูปแบบแผนผังเว็บไซต์

Google รองรับแผนผังเว็บไซต์หลายรูปแบบ ดังนี้

และทุกรูปแบบควรมีโปรโตคอลแผนผังเว็บไซต์มาตรฐาน ปัจจุบัน Google ไม่ได้ใช้แอตทริบิวต์ <priority> ในแผนผังเว็บไซต์

ทุกรูปแบบจะจำกัดขนาดแผนผังเว็บไซต์เดี่ยวอยู่ที่ 50 MB (ไม่บีบอัด) และ URL 50,000 รายการ หากมีไฟล์ขนาดใหญ่กว่านี้หรือมี URL มากกว่านี้ จะต้องแยกแผนผังเว็บไซต์ออกเป็นหลายๆ รายการ คุณสร้างไฟล์ดัชนีแผนผังเว็บไซต์ (ไฟล์ที่ชี้ไปยังรายการแผนผังเว็บไซต์) และส่งไฟล์ดัชนีไฟล์เดียวนั้นไปยัง Google ได้หากต้องการ หรือจะส่งแผนผังเว็บไซต์หลายรายการและ/หรือไฟล์ดัชนีแผนผังเว็บไซต์หลายไฟล์ไปยัง Google ก็ได้

XML

ต่อไปนี้คือแผนผังเว็บไซต์ XML พื้นฐานที่สุดที่มีตำแหน่งของ URL เดี่ยว

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.example.com/foo.html</loc>
    <lastmod>2018-06-04</lastmod>
  </url>
</urlset>

ดูตัวอย่างที่ซับซ้อนมากขึ้นและเอกสารประกอบฉบับเต็มได้ที่ sitemaps.org

ดูตัวอย่างแผนผังเว็บไซต์ที่ระบุหน้าภาษาอื่นและแผนผังเว็บไซต์สำหรับไฟล์ข่าว รูปภาพ หรือวิดีโอได้

RSS, mRSS และ Atom 1.0

หากมีบล็อกที่มีฟีด RSS หรือ Atom ก็ส่ง URL ของฟีดเป็นแผนผังเว็บไซต์ได้ ซอฟต์แวร์บล็อกส่วนใหญ่สร้างฟีดให้คุณได้ แต่โปรดทราบว่าฟีดนี้ให้ข้อมูลเกี่ยวกับ URL ล่าสุดเท่านั้น

  • Google รับฟีด RSS 2.0 และ Atom 1.0
  • คุณใช้ฟีด mRSS (media RSS) เพื่อส่งรายละเอียดเกี่ยวกับเนื้อหาวิดีโอในเว็บไซต์ให้ Google ได้

Text

หากแผนผังเว็บไซต์มีเฉพาะ URL ของหน้าเว็บ คุณส่งไฟล์ข้อความธรรมดาที่มี 1 URL ต่อบรรทัดให้ Google ได้ เช่น

http://www.example.com/file1.html
http://www.example.com/file2.html

หลักเกณฑ์สำหรับแผนผังเว็บไซต์แบบไฟล์ข้อความมีดังนี้

  • เข้ารหัสไฟล์โดยใช้การเข้ารหัส UTF-8
  • อย่าใส่ข้อมูลอื่นที่ไม่ใช่ URL ในไฟล์แผนผังเว็บไซต์
  • คุณจะตั้งชื่อไฟล์ข้อความว่าอะไรก็ได้ ตราบใดที่ไฟล์นั้นมีนามสกุล .txt (เช่น sitemap.txt)

ส่วนขยายแผนผังเว็บไซต์สำหรับสื่อประเภทอื่นๆ

Google รองรับไวยากรณ์แผนผังเว็บไซต์เพิ่มเติมสำหรับสื่อประเภทต่อไปนี้ โปรดใช้ส่วนขยายเหล่านี้เพื่ออธิบายไฟล์วิดีโอ รูปภาพ และเนื้อหาอื่นๆ ที่ยากต่อการแยกวิเคราะห์ในเว็บไซต์ของคุณเพื่อปรับปรุงการจัดทำดัชนี

หลักเกณฑ์ทั่วไปสำหรับแผนผังเว็บไซต์

  • ใช้ URL ที่สม่ำเสมอและสมบูรณ์ในตัวเอง Google จะรวบรวมข้อมูลจาก URL ตรงตามที่ระบุทุกประการ ตัวอย่างเช่น หากเว็บไซต์อยู่ที่ https://www.example.com/ อย่าระบุ URL เป็น https://example.com/ (ไม่มี www) หรือ ./mypage.html (URL แบบสัมพัทธ์)
  • คุณโพสต์แผนผังเว็บไซต์ที่ตำแหน่งใดก็ได้ในเว็บไซต์ แต่แผนผังเว็บไซต์จะมีผลเฉพาะกับไดเรกทอรีที่สืบทอดจากไดเรกทอรีระดับบนสุด ดังนั้น แผนผังเว็บไซต์ที่โพสต์ไว้ที่รูทของเว็บไซต์ซึ่งเป็นตำแหน่งที่เราแนะนำให้โพสต์แผนผังเว็บไซต์นั้นจะมีผลกับทุกไฟล์ในเว็บไซต์
  • อย่ารวมรหัสเซสชันจาก URL ในแผนผังเว็บไซต์ วิธีนี้จะช่วยลดการรวบรวมข้อมูล URL เหล่านั้นซ้ำกัน
  • แจ้งให้ Google ทราบเกี่ยวกับเวอร์ชันภาษาอื่นๆ ของ URL โดยใช้ข้อมูลเสริม hreflang
  • ไฟล์แผนผังเว็บไซต์ต้องมีการเข้ารหัส UTF-8 และใช้อักขระหลีกกับ URL อย่างเหมาะสม
  • แยกแผนผังเว็บไซต์ขนาดใหญ่เป็นแผนผังเว็บไซต์ขนาดเล็ก โดยมี URL ได้สูงสุด 50,000 รายการ และต้องมีขนาดไม่เกิน 50 MB เมื่อไม่ได้บีบอัด ใช้ไฟล์ดัชนีแผนผังเว็บไซต์เพื่อแสดงแผนผังเว็บไซต์ทั้งหมดและส่งไฟล์เดี่ยวนี้ไปยัง Google แทนการส่งแผนผังเว็บไซต์แต่ละรายการ
  • แสดงเฉพาะ Canonical URL ในแผนผังเว็บไซต์ หากคุณมีหน้าเว็บ 2 เวอร์ชัน ให้ระบุเฉพาะเวอร์ชันที่ต้องการให้ปรากฏในผลการค้นหาไว้ในแผนผังเว็บไซต์ หากคุณมีเว็บไซต์ 2 เวอร์ชัน (เช่น มี www และไม่มี www) ให้ตัดสินใจว่าจะใช้เว็บไซต์ใดเป็นหลัก แล้วใส่แผนผังเว็บไซต์ไว้ที่เว็บไซต์นั้น และเพิ่ม rel=canonical หรือการเปลี่ยนเส้นทางไว้ในอีกเว็บไซต์หนึ่ง
  • หากคุณมี URL ที่ต่างกันสำหรับหน้าเว็บรุ่นอุปกรณ์เคลื่อนที่และรุ่นเดสก์ท็อป ขอแนะนำให้ชี้ไปที่เวอร์ชันเดียวเท่านั้นในแผนผังเว็บไซต์ แต่หากต้องการชี้ไปที่ URL ทั้ง 2 แบบ ให้ใส่ข้อมูลเสริมใน URL เพื่อระบุว่าเป็นรุ่นเดสก์ท็อปและรุ่นอุปกรณ์เคลื่อนที่
  • ใช้ส่วนขยายแผนผังเว็บไซต์เพื่อชี้ไปที่สื่อประเภทอื่นๆ เช่น วิดีโอ รูปภาพ และข่าว
  • หากมีหน้าเว็บสำหรับภาษาหรือภูมิภาคอื่น คุณจะใช้ hreflang ในแผนผังเว็บไซต์หรือใช้แท็ก html เพื่อระบุ URL ทางเลือกได้
  • อักขระที่ไม่ใช่ตัวอักษรผสมตัวเลขและตัวอักษรละติน เรากำหนดให้ไฟล์แผนผังเว็บไซต์ต้องเข้ารหัสแบบ UTF-8 (โดยทั่วไปคุณจะทำได้เมื่อบันทึกไฟล์) และเช่นเดียวกับไฟล์ XML ทั้งหมด ค่าของข้อมูลทุกค่า (รวมทั้ง URL) ต้องใช้รหัสอักขระหลีกเอนทิตีสำหรับอักขระที่แสดงในตารางด้านล่างนี้ แผนผังเว็บไซต์มีได้เฉพาะอักขระ ASCII เท่านั้น ต้องไม่มีอักขระ ASCII แบบขยาย หรือรหัสควบคุมบางรหัส หรือสัญลักษณ์พิเศษ เช่น * และ {} หาก URL ของแผนผังเว็บไซต์มีอักขระเหล่านี้ คุณจะได้รับข้อผิดพลาดเมื่อพยายามเพิ่ม URL
    อักขระ สัญลักษณ์ โค้ดอักขระหลีก
    เครื่องหมาย & & &amp;
    เครื่องหมายคำพูดเดี่ยว ' &apos;
    เครื่องหมายคำพูดคู่ " &quot;
    เครื่องหมายมากกว่า > &gt;
    เครื่องหมายน้อยกว่า < &lt;

    นอกจากนี้ URL ทั้งหมด (รวมถึง URL ของแผนผังเว็บไซต์) ต้องมีการเข้ารหัสเพื่อให้เว็บเซิร์ฟเวอร์ที่โฮสต์ URL นั้นและใช้อักขระหลีกกับ URL สามารถอ่านได้ อย่างไรก็ตาม หากคุณใช้สคริปต์ เครื่องมือ หรือไฟล์บันทึกประเภทใดก็ตามเพื่อสร้าง URL (ทุกสิ่งยกเว้นการพิมพ์ URL เองด้วยมือ) จะมีการเข้ารหัสดังกล่าวให้อยู่แล้ว หากคุณส่งแผนผังเว็บไซต์แล้วมีข้อผิดพลาดแสดงขึ้นว่า Google ไม่พบ URL บางรายการ โปรดตรวจสอบว่า URL เป็นไปตามมาตรฐาน RFC-3986 สำหรับ URI, มาตรฐาน RFC-3987 สำหรับ IRI และมาตรฐาน XML

    ต่อไปนี้คือตัวอย่าง URL ที่ใช้อักขระที่ไม่ใช่ ASCII (ü) และอักขระที่ต้องใช้อักขระหลีกกับเอนทิตี (&)

    http://www.example.com/ümlat.html&q=name

    ต่อไปนี้เป็น URL เดียวกัน แต่มีการเข้ารหัส ISO-8859-1 (สำหรับการโฮสต์บนเซิร์ฟเวอร์ที่ใช้การเข้ารหัสนั้น) และใช้อักขระหลีกกับ URL

    http://www.example.com/%FCmlat.html&q=name

    ต่อไปนี้เป็น URL เดียวกัน แต่มีการเข้ารหัส UTF-8 (สำหรับการโฮสต์บนเซิร์ฟเวอร์ที่ใช้การเข้ารหัสนั้น) และใช้อักขระหลีกกับ URL

    http://www.example.com/%C3%BCmlat.html&q=name

    ต่อไปนี้เป็น URL เดียวกัน แต่มีการใช้อักขระหลีกกับเอนทิตี

    http://www.example.com/%C3%BCmlat.html&amp;q=name
  • โปรดทราบว่าแผนผังเว็บไซต์จะเป็นสิ่งที่แนะนำให้ Google ทราบถึงหน้าเว็บที่คุณคิดว่าสำคัญ โดย Google ไม่ได้รับประกันว่าจะรวบรวมข้อมูลทุก URL ในแผนผังเว็บไซต์
  • Google ไม่สนใจค่า <priority> และ <changefreq>
  • Google จะใช้ค่า <lastmod> ในกรณีที่ค่านั้นมีความถูกต้องเสมอและยืนยันได้ (เช่น โดยการเปรียบเทียบกับการแก้ไขหน้าเว็บครั้งล่าสุด)
  • ตำแหน่งของ URL ในแผนผังเว็บไซต์ไม่สำคัญ เนื่องจาก Google จะไม่รวบรวมข้อมูล URL ตามลำดับที่ปรากฏในแผนผังเว็บไซต์

สร้างแผนผังเว็บไซต์

เมื่อสร้างแผนผังเว็บไซต์ คุณกำลังบอกเครื่องมือค้นหาว่าต้องการแสดง URL ใดในผลการค้นหา URL เหล่านี้คือ Canonical URL หากคุณมีเนื้อหาเดียวกันซึ่งเข้าถึงได้ภายใต้ URL อื่น ให้เลือก URL ที่ต้องการและรวมไว้ในแผนผังเว็บไซต์แทน URL ทั้งหมดที่นำไปสู่เนื้อหาเดียวกัน

เมื่อตัดสินใจได้แล้วว่าจะรวม URL ใดไว้ในแผนผังเว็บไซต์ ให้เลือกวิธีสร้างแผนผังเว็บไซต์ต่อไปนี้ โดยขึ้นอยู่กับสถาปัตยกรรมเว็บไซต์และขนาดของเว็บไซต์

ให้ CMS สร้างแผนผังเว็บไซต์สำหรับคุณ

หากคุณใช้ CMS เช่น WordPress, Wix หรือ Blogger ก็เป็นไปได้ว่า CMS ได้สร้างแผนผังเว็บไซต์ไว้ให้เครื่องมือค้นหาแล้ว ลองค้นหาข้อมูลเกี่ยวกับวิธีที่ CMS สร้างแผนผังเว็บไซต์ หรือวิธีสร้างหาก CMS ไม่ได้สร้างแผนผังเว็บไซต์โดยอัตโนมัติ เช่น ในกรณีของ Wix ให้ค้นหา "แผนผังเว็บไซต์ของ Wix"

สําหรับการตั้งค่าอื่นๆ ทั้งหมดของเว็บไซต์ คุณจะต้องสร้างแผนผังเว็บไซต์ด้วยตัวเอง

สร้างแผนผังเว็บไซต์ด้วยต้วเอง

คุณอาจสร้างแผนผังเว็บไซต์ด้วยตัวเองได้ในกรณีที่มี URL ไม่กี่สิบรายการ โดยเปิดเครื่องมือแก้ไขข้อความเช่น Windows Notepad หรือ Nano (Linux, MacOS) และทำตามไวยากรณ์ที่อธิบายในส่วนรูปแบบแผนผังเว็บไซต์

คุณสร้างแผนผังเว็บไซต์ที่ใหญ่ขึ้นด้วยตัวเองได้ แต่ก็เป็นขั้นตอนที่น่าเบื่อ

สร้างแผนผังเว็บไซต์โดยอัตโนมัติ

คุณจะต้องสร้างแผนผังเว็บไซต์ในกรณีที่มี URL หลายสิบรายการ มีเครื่องมือหลายอย่างที่สร้างแผนผังเว็บไซต์ได้ แต่วิธีที่ดีที่สุดคือการใช้ซอฟต์แวร์เว็บไซต์สร้างให้ เช่น คุณสามารถดึง URL ของเว็บไซต์ออกจากฐานข้อมูลแล้วส่งออกไปยังหน้าจอหรือไฟล์จริงในเว็บเซิร์ฟเวอร์ได้ คุยกับนักพัฒนาซอฟต์แวร์หรือผู้จัดการเซิร์ฟเวอร์เกี่ยวกับโซลูชันนี้ หากต้องการคำแนะนำเกี่ยวกับโค้ด ลองดูคอลเล็กชันโปรแกรมสร้างแผนผังเว็บไซต์ของบุคคลที่สามเก่าของเรา

โปรดทราบว่าแผนผังเว็บไซต์ต้องมีขนาดไม่เกิน 50 MB ดูข้อมูลเพิ่มเติมเกี่ยวกับการจัดการแผนผังเว็บไซต์ขนาดใหญ่

ส่งแผนผังเว็บไซต์ไปยัง Google

Google ไม่ได้ตรวจสอบแผนผังเว็บไซต์ทุกครั้งที่มีการเข้ารวบรวมข้อมูล โดยจะตรวจสอบเฉพาะครั้งแรกที่เราเห็น และจะมีการตรวจสอบอีกหลังจากนั้นก็ต่อเมื่อคุณใช้คำสั่ง ping เพื่อแจ้งให้เราทราบว่ามีการเปลี่ยนแปลง แจ้ง Google เกี่ยวกับแผนผังเว็บไซต์เฉพาะเมื่อเป็นแผนผังใหม่หรือเมื่อมีการอัปเดต อย่าส่งหรือใช้คำสั่ง ping แผนผังเว็บไซต์ที่ไม่มีการเปลี่ยนแปลงหลายครั้ง

หากคุณได้อัปเดตหน้าเว็บในแผนผังเว็บไซต์ ให้บอก Google ด้วยเขตข้อมูล <lastmod> ไฟล์ XML อื่นๆ จะมีเขตข้อมูลคล้ายๆ กัน เช่น <updated> สำหรับ Atom XML โปรดดูวิธีคำนวณวันที่นี้

การทำให้แผนผังเว็บไซต์พร้อมใช้งานสำหรับ Google มีหลายวิธีดังนี้

  • ส่งแผนผังเว็บไซต์โดยใช้รายงานแผนผังเว็บไซต์
  • ใช้เครื่องมือคำสั่ง ping ส่งคำขอ GET ในเบราว์เซอร์หรือผ่านบรรทัดคำสั่งไปยังที่อยู่นี้ โดยระบุ URL แบบเต็มของแผนผังเว็บไซต์ โปรดตรวจสอบว่าไฟล์แผนผังเว็บไซต์นั้นเข้าถึงได้
    https://www.google.com/ping?sitemap=FULL_URL_OF_SITEMAP

    เช่น

    https://www.google.com/ping?sitemap=https://example.com/sitemap.xml
  • ใส่บรรทัดต่อไปนี้ไว้ที่ใดก็ได้ในไฟล์ robots.txt โดยระบุเส้นทางไปยังแผนผังเว็บไซต์ เราจะเห็นเส้นทางไปยังแผนผังเว็บไซต์เมื่อรวบรวมข้อมูลไฟล์ robots.txt ในครั้งถัดไป
    Sitemap: https://example.com/my_sitemap.xml
  • ใช้ WebSub หากคุณใช้ Atom/RSS สำหรับแผนผังเว็บไซต์และต้องการประกาศการเปลี่ยนแปลงไปยังเครื่องมือค้นหาอื่นๆ ที่นอกเหนือจาก Google

การแก้ปัญหาแผนผังเว็บไซต์

ดูคำแนะนำในการแก้ปัญหาแผนผังเว็บไซต์