สร้างและส่งแผนผังเว็บไซต์
หน้านี้จะอธิบายวิธีสร้างแผนผังเว็บไซต์และทำให้ใช้งานกับ Google ได้ ดูข้อมูลเพิ่มเติมเกี่ยวกับแผนผังเว็บไซต์ที่นี่
- เลือกหน้าในเว็บไซต์ที่ควรให้ Google รวบรวมข้อมูล และกำหนดเวอร์ชัน Canonical ของแต่ละหน้า
- เลือกรูปแบบแผนผังเว็บไซต์ที่ต้องการใช้ คุณจะสร้างแผนผังเว็บไซต์ด้วยตนเองหรือจะเลือกจากเครื่องมือของบุคคลที่สามซึ่งมีอยู่หลายอย่างเพื่อสร้างแผนผังเว็บไซต์ก็ได้
- ทำให้แผนผังเว็บไซต์พร้อมใช้งานสำหรับ Google โดยเพิ่มไปยังไฟล์ robots.txt หรือส่งไปที่ Search Console โดยตรง
รูปแบบแผนผังเว็บไซต์
Google รองรับแผนผังเว็บไซต์รูปแบบต่างๆ ตามที่อธิบายไว้ที่นี่ และทุกรูปแบบควรมีโปรโตคอลแผนผังเว็บไซต์มาตรฐาน ปัจจุบัน Google ไม่ได้ใช้แอตทริบิวต์ <priority>
ในแผนผังเว็บไซต์
ทุกรูปแบบจะจำกัดขนาดแผนผังเว็บไซต์เดี่ยวอยู่ที่ 50 MB (ไม่บีบอัด) และ URL 50,000 รายการ หากมีไฟล์ขนาดใหญ่กว่านี้หรือมี URL มากกว่านี้ จะต้องแยกแผนผังเว็บไซต์ออกเป็นหลายๆ รายการ คุณสร้างไฟล์ดัชนีแผนผังเว็บไซต์ (ไฟล์ที่ชี้ไปยังรายการแผนผังเว็บไซต์) และส่งไฟล์ดัชนีไฟล์เดียวนั้นไปยัง Google ได้หากต้องการ หรือจะส่งแผนผังเว็บไซต์หลายรายการและ/หรือไฟล์ดัชนีแผนผังเว็บไซต์หลายไฟล์ไปยัง Google ก็ได้
XML
ต่อไปนี้คือแผนผังเว็บไซต์ XML พื้นฐานที่สุดที่มีตำแหน่งของ URL เดี่ยว
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.example.com/foo.html</loc> <lastmod>2018-06-04</lastmod> </url> </urlset>
ดูตัวอย่างที่ซับซ้อนมากขึ้นและเอกสารประกอบฉบับเต็มได้ที่ sitemaps.org
ดูตัวอย่างแผนผังเว็บไซต์ที่ระบุหน้าภาษาอื่นและแผนผังเว็บไซต์สำหรับไฟล์ข่าว รูปภาพ หรือวิดีโอได้
RSS, mRSS และ Atom 1.0
หากมีบล็อกที่มีฟีด RSS หรือ Atom ก็ส่ง URL ของฟีดเป็นแผนผังเว็บไซต์ได้ ซอฟต์แวร์บล็อกส่วนใหญ่สร้างฟีดให้คุณได้ แต่โปรดทราบว่าฟีดนี้ให้ข้อมูลเกี่ยวกับ URL ล่าสุดเท่านั้น
- Google รับฟีด RSS 2.0 และ Atom 1.0
- คุณใช้ฟีด mRSS (media RSS) เพื่อส่งรายละเอียดเกี่ยวกับเนื้อหาวิดีโอในเว็บไซต์ให้ Google ได้
Text
หากแผนผังเว็บไซต์มีเฉพาะ URL ของหน้าเว็บ คุณส่งไฟล์ข้อความธรรมดาที่มี 1 URL ต่อบรรทัดให้ Google ได้ เช่น
http://www.example.com/file1.html http://www.example.com/file2.html
หลักเกณฑ์สำหรับแผนผังเว็บไซต์แบบไฟล์ข้อความมีดังนี้
- เข้ารหัสไฟล์โดยใช้การเข้ารหัส UTF-8
- อย่าใส่ข้อมูลอื่นที่ไม่ใช่ URL ในไฟล์แผนผังเว็บไซต์
- คุณจะตั้งชื่อไฟล์ข้อความว่าอะไรก็ได้ ตราบใดที่ไฟล์นั้นมีนามสกุล .txt (เช่น sitemap.txt)
ส่วนขยายแผนผังเว็บไซต์สำหรับสื่อประเภทอื่นๆ
Google รองรับไวยากรณ์แผนผังเว็บไซต์เพิ่มเติมสำหรับสื่อประเภทต่อไปนี้ โปรดใช้ส่วนขยายเหล่านี้เพื่ออธิบายไฟล์วิดีโอ รูปภาพ และเนื้อหาอื่นๆ ที่ยากต่อการแยกวิเคราะห์ในเว็บไซต์ของคุณเพื่อปรับปรุงการจัดทำดัชนี
หลักเกณฑ์ทั่วไปสำหรับแผนผังเว็บไซต์
-
ใช้ URL ที่สอดคล้องกันและอยู่ในรูปแบบเต็ม Google จะรวบรวมข้อมูลจาก URL ตรงตามที่ระบุทุกประการ
ตัวอย่างเช่น หากเว็บไซต์อยู่ที่
https://www.example.com/
อย่าระบุ URL เป็นhttps://example.com/
(ไม่มีwww
) หรือ./mypage.html
(URL แบบสัมพัทธ์) - คุณโพสต์แผนผังเว็บไซต์ที่ตำแหน่งใดก็ได้ในเว็บไซต์ แต่แผนผังเว็บไซต์จะมีผลเฉพาะกับไดเรกทอรีที่สืบทอดจากไดเรกทอรีระดับบนสุด ดังนั้น แผนผังเว็บไซต์ที่โพสต์ไว้ที่รูทของเว็บไซต์ซึ่งเป็นตำแหน่งที่เราแนะนำให้โพสต์แผนผังเว็บไซต์นั้นจะมีผลกับทุกไฟล์ในเว็บไซต์
- อย่ารวมรหัสเซสชันจาก URL ในแผนผังเว็บไซต์ วิธีนี้จะช่วยลดการรวบรวมข้อมูล URL เหล่านั้นซ้ำกัน
- แจ้งให้ Google ทราบเกี่ยวกับเวอร์ชันภาษาทางเลือกของ URL โดยใช้ข้อมูลเสริม hreflang
- ไฟล์แผนผังเว็บไซต์ต้องมีการเข้ารหัส UTF-8 และใช้อักขระหลีกกับ URL อย่างเหมาะสม
- แยกแผนผังเว็บไซต์ขนาดใหญ่เป็นแผนผังเว็บไซต์ขนาดเล็ก โดยมี URL ได้สูงสุด 50,000 รายการและต้องมีขนาดไม่เกิน 50 MB เมื่อไม่ได้บีบอัด ใช้ไฟล์ดัชนีแผนผังเว็บไซต์เพื่อแสดงแผนผังเว็บไซต์ทั้งหมดและส่งไฟล์เดี่ยวนี้ไปยัง Google แทนการส่งแผนผังเว็บไซต์แต่ละรายการ
-
แสดงเฉพาะ Canonical URL ในแผนผังเว็บไซต์ หากคุณมีหน้าเว็บ 2 เวอร์ชัน ให้ระบุเฉพาะเวอร์ชันที่ต้องการให้ปรากฏในผลการค้นหาไว้ในแผนผังเว็บไซต์ หากคุณมีเว็บไซต์ 2 เวอร์ชัน (เช่น มี www และไม่มี www) ให้ตัดสินใจว่าจะใช้เว็บไซต์ใดเป็นหลัก แล้วใส่แผนผังเว็บไซต์ไว้ที่เว็บไซต์นั้น และเพิ่ม
rel=canonical
หรือการเปลี่ยนเส้นทางไว้ในอีกเว็บไซต์หนึ่ง - หากคุณมี URL ที่ต่างกันสำหรับหน้าเว็บรุ่นอุปกรณ์เคลื่อนที่และรุ่นเดสก์ท็อป ขอแนะนำให้ชี้ไปที่เวอร์ชันเดียวเท่านั้นในแผนผังเว็บไซต์ แต่หากต้องการชี้ไปที่ URL ทั้งคู่ ให้ใส่ข้อมูลเสริมใน URL เพื่อระบุว่าเป็นรุ่นเดสก์ท็อปและรุ่นอุปกรณ์เคลื่อนที่
- ใช้ส่วนขยายแผนผังเว็บไซต์เพื่อชี้ไปที่สื่อประเภทอื่นๆ เช่น วิดีโอ รูปภาพ และข่าว
- หากมีหน้าเว็บทางเลือกสำหรับภาษาหรือภูมิภาคอื่น คุณจะใช้ hreflang ในแผนผังเว็บไซต์หรือแท็ก html เพื่อระบุ URL ทางเลือกได้
-
อักขระที่ไม่ใช่ตัวอักษรผสมตัวเลขและตัวอักษรละติน
เรากำหนดให้ไฟล์แผนผังเว็บไซต์ต้องเข้ารหัสแบบ UTF-8 (โดยทั่วไปคุณจะทำได้เมื่อบันทึกไฟล์) และเช่นเดียวกับไฟล์ XML ทั้งหมด ค่าของข้อมูลทุกค่า (รวมทั้ง URL) ต้องใช้รหัสอักขระหลีกเอนทิตีสำหรับอักขระที่แสดงในตารางด้านล่างนี้ แผนผังเว็บไซต์มีได้เฉพาะอักขระ ASCII เท่านั้น ต้องไม่มีอักขระ ASCII ตัวพิมพ์ใหญ่ หรือรหัสควบคุมบางรหัส หรือสัญลักษณ์พิเศษ เช่น
*
และ{}
หาก URL ของแผนผังเว็บไซต์มีอักขระเหล่านี้ คุณจะได้รับข้อผิดพลาดเมื่อพยายามเพิ่ม URLอักขระ รหัสอักขระหลีก เครื่องหมาย & &
&
เครื่องหมายคำพูดเดี่ยว '
'
เครื่องหมายคำพูดคู่ "
"
เครื่องหมายมากกว่า >
>
เครื่องหมายน้อยกว่า <
<
ต่อไปนี้คือตัวอย่าง URL ที่ใช้อักขระที่ไม่ใช่ ASCII (ü
) และอักขระที่ต้องใช้อักขระหลีกเอนทิตี (&
):
http://www.example.com/ümlat.html&q=name
ต่อไปนี้เป็น URL เดียวกันซึ่งมีการเข้ารหัส ISO-8859-1 (สำหรับการโฮสต์บนเซิร์ฟเวอร์ที่ใช้การเข้ารหัสนั้น) และใช้อักขระหลีกกับ URL
http://www.example.com/%FCmlat.html&q=name
ต่อไปนี้เป็น URL เดียวกันซึ่งมีการเข้ารหัส UTF-8 (สำหรับการโฮสต์บนเซิร์ฟเวอร์ที่ใช้การเข้ารหัสนั้น) และใช้อักขระหลีกกับ URL
http://www.example.com/%C3%BCmlat.html&q=name
ต่อไปนี้เป็น URL เดียวกันซึ่งใช้อักขระหลีกเอนทิตี
http://www.example.com/%C3%BCmlat.html&q=name
- โปรดทราบว่าแผนผังเว็บไซต์เป็นคำแนะนำให้ Google ทราบถึงหน้าเว็บที่คุณคิดว่าสำคัญ Google ไม่ได้รับประกันว่าจะรวบรวมข้อมูลทุก URL ในแผนผังเว็บไซต์
-
Google ไม่สนใจค่า
<priority>
และ<changefreq>
-
Google จะใช้ค่า
<lastmod>
ในกรณีที่มีความถูกต้องเสมอและยืนยันได้ (เช่น โดยการเปรียบเทียบกับการแก้ไขหน้าเว็บครั้งล่าสุด) - ตำแหน่งของ URL ในแผนผังเว็บไซต์ไม่สำคัญ เนื่องจาก Google จะไม่รวบรวมข้อมูล URL ตามลำดับที่ปรากฏในแผนผังเว็บไซต์
ทำให้แผนผังเว็บไซต์พร้อมใช้งานสำหรับ Google (ส่งแผนผังเว็บไซต์ไปยัง Google)
Google ไม่ได้ตรวจสอบแผนผังเว็บไซต์ทุกครั้งที่มีการเข้ารวบรวมข้อมูล โดยจะตรวจสอบเฉพาะครั้งแรกที่เราเห็น และจะมีการตรวจสอบอีกหลังจากนั้นก็ต่อเมื่อคุณใช้คำสั่ง ping เพื่อแจ้งให้เราทราบว่ามีการเปลี่ยนแปลง คุณควรแจ้ง Google เกี่ยวกับแผนผังเว็บไซต์เฉพาะเมื่อเป็นแผนผังใหม่หรือเมื่อมีการอัปเดต อย่าส่งหรือใช้คำสั่ง ping แผนผังเว็บไซต์ที่ไม่มีการเปลี่ยนแปลงหลายครั้ง
การทำให้แผนผังเว็บไซต์พร้อมใช้งานสำหรับ Google มีหลายวิธีดังนี้
- ส่งไปยัง Google โดยใช้รายงานแผนผังเว็บไซต์ของ Search Console
-
ใส่บรรทัดต่อไปนี้ไว้ที่ใดก็ได้ในไฟล์
robots.txt
โดยระบุเส้นทางไปยังแผนผังเว็บไซต์
Sitemap: http://example.com/sitemap_location.xml
-
ใช้บริการ "ping" เพื่อขอให้ Google รวบรวมข้อมูลแผนผังเว็บไซต์ ส่งคำขอ HTTP GET ลักษณะนี้
http://www.google.com/ping?sitemap=<complete_url_of_sitemap>
ตัวอย่างเช่น
http://www.google.com/ping?sitemap=https://example.com/sitemap.xml
การแก้ปัญหาแผนผังเว็บไซต์
ดูคำแนะนำในการแก้ปัญหาแผนผังเว็บไซต์