แนวทางปฏิบัติแนะนําเกี่ยวกับโครงสร้าง URL สําหรับ Google Search
ใช้โครงสร้าง URL ที่ทำการ Crawl ได้ซึ่งเป็นไปตามข้อกำหนดต่อไปนี้เพื่อให้ Google Search ทำการ Crawl เว็บไซต์ได้อย่างมีประสิทธิภาพ หาก URL ไม่เป็นไปตามเกณฑ์ต่อไปนี้ Google Search มีแนวโน้มที่จะทำการ Crawl เว็บไซต์อย่างไม่มีประสิทธิภาพ ซึ่งรวมถึงแต่ไม่จำกัดเพียงอัตราการ Crawl ที่สูงมาก หรือไม่ทำการ Crawl เลย
ข้อกำหนดสำหรับโครงสร้าง URL ที่ทำการ Crawl ได้ | |||||||
---|---|---|---|---|---|---|---|
ปฏิบัติตาม IETF STD 66 |
Google Search รองรับ URL ที่กําหนดโดย IETF STD 66 อักขระที่กำหนดโดยมาตรฐานเป็นสงวนไว้ต้องเข้ารหัสด้วยเครื่องหมายเปอร์เซ็นต์ |
||||||
อย่าใช้ส่วนย่อย URLเพื่อเปลี่ยนเนื้อหา |
อย่าใช้ส่วนย่อยเพื่อเปลี่ยนเนื้อหาของหน้าเว็บ เนื่องจากโดยทั่วไป Google Search ยังไม่รองรับส่วนย่อย URL ตัวอย่างส่วนย่อย URL https://example.com/#/potatoes หากคุณใช้ JavaScript เพื่อเปลี่ยนเนื้อหา ให้ใช้ History API แทน |
||||||
ใช้การเข้ารหัสทั่วไปสำหรับพารามิเตอร์ของ URL |
เมื่อระบุพารามิเตอร์ของ URL ให้ใช้การเข้ารหัสทั่วไปต่อไปนี้ เครื่องหมายเท่ากับ (
|
ทําให้เข้าใจโครงสร้าง URL ได้ง่าย
เราขอแนะนําให้สร้างโครงสร้าง URL ที่เรียบง่ายและใช้แนวทางปฏิบัติแนะนําต่อไปนี้เมื่อเป็นไปได้ เพื่อช่วยให้ Google Search (และผู้ใช้) เข้าใจเว็บไซต์ของคุณได้ดียิ่งขึ้น
แนวทางปฏิบัติแนะนำ | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
ใช้ URL ที่สื่อความหมาย |
หากเป็นไปได้ ให้ใช้คำที่อ่านได้ใน URL แทนที่จะเป็นตัวเลขรหัสยาวๆ
|
||||||||||
ใช้ภาษาของกลุ่มเป้าหมาย |
ใช้คำในภาษาของกลุ่มเป้าหมายใน URL (และคำที่ถอดเสียง หากมี) เช่น หากกลุ่มเป้าหมายค้นหาเป็นภาษาเยอรมัน ให้ใช้คำภาษาเยอรมันใน URL https://example.com/lebensmittel/pfefferminz หรือหากกลุ่มเป้าหมายค้นหาเป็นภาษาญี่ปุ่น ให้ใช้คำภาษาญี่ปุ่นใน URL https://example.com/ペパーミント |
||||||||||
ใช้การเข้ารหัสแบบ UTF-8 ตามที่จำเป็น |
เมื่อลิงก์ไปยังหน้าในเว็บไซต์ ให้ใช้การเข้ารหัส UTF-8 ในแอตทริบิวต์
|
||||||||||
ใช้ขีดกลางเพื่อแยกคำ |
เราขอแนะนำให้แยกคำใน URL หากเป็นไปได้ กล่าวโดยละเอียดคือ เราขอแนะนำให้ใช้ขีดกลาง (
|
||||||||||
ใช้พารามิเตอร์ให้น้อยที่สุดเท่าที่จะทำได้ |
หากเป็นไปได้ ให้ทำให้ URL สั้นลงโดยตัดพารามิเตอร์ที่ไม่จำเป็นออก (หมายถึงพารามิเตอร์ที่ไม่เปลี่ยนแปลงเนื้อหา) | ||||||||||
โปรดทราบว่า URL จะคำนึงถึงตัวพิมพ์เล็กและตัวพิมพ์ใหญ่ |
เช่นเดียวกับไคลเอ็นต์ HTTP อื่นๆ ที่เป็นไปตาม IETF STD 66 การจัดการ URL ของ Google Search จะคำนึงถึงตัวพิมพ์เล็กและตัวพิมพ์ใหญ่ (เช่น Google จะถือว่าทั้ง /APPLE และ /apple เป็น URL ที่แตกต่างกันซึ่งมีเนื้อหาเป็นของตนเอง) หากเว็บเซิร์ฟเวอร์ถือว่าข้อความตัวพิมพ์ใหญ่และตัวพิมพ์เล็กใน URL เป็นข้อความเดียวกัน ให้แปลงข้อความทั้งหมดเป็นตัวพิมพ์แบบเดียวกันเพื่อให้ Google ระบุว่า URL เหล่านั้นอ้างอิงหน้าเดียวกันได้ง่ายขึ้น
|
||||||||||
สำหรับเว็บไซต์หลายภูมิภาค |
หากเว็บไซต์เป็นแบบหลายภูมิภาค ให้พิจารณาใช้โครงสร้าง URL ที่ช่วยลดความยุ่งยากในการกำหนดเป้าหมายตามภูมิศาสตร์บนเว็บไซต์ ดูตัวอย่างเพิ่มเติมเกี่ยวกับวิธีจัดโครงสร้าง URL ได้ที่การใช้ URL ภาษาท้องถิ่น แนะนำ (ใช้โดเมนเจาะจงประเทศ) https://example.de แนะนำ (ใช้ไดเรกทอรีย่อยเจาะจงประเทศที่มี gTLD) https://example.com/de/ |
หลีกเลี่ยงปัญหาที่พบบ่อยเกี่ยวกับ URL
URL ที่ซับซ้อนเกินไป โดยเฉพาะ URL ที่มีพารามิเตอร์หลายตัว อาจทำให้เกิดปัญหาสำหรับโปรแกรมรวบรวมข้อมูลโดยสร้าง URL ซึ่งชี้ไปยังเนื้อหาที่เหมือนกันหรือคล้ายคลึงกันในเว็บไซต์ของคุณในจำนวนที่มากเกินจำเป็น ดังนั้น Googlebot อาจใช้แบนด์วิดท์เกินกว่าที่จำเป็นมาก หรือ Google Search อาจจัดทำดัชนีเนื้อหาทั้งหมดในเว็บไซต์ได้ไม่สมบูรณ์
URL จำนวนมากที่ไม่มีความจำเป็นสามารถเกิดจากปัญหาหลายประการ ดังนี้:
ปัญหาที่พบได้ทั่วไป | |
---|---|
การกรองชุดรายการที่เพิ่มตัวกรองแยกย่อย |
การกรองชุดของรายการที่เพิ่มตัวกรองแยกย่อย เว็บไซต์หลายแห่งแสดงมุมมองที่แตกต่างกันสำหรับชุดรายการหรือผลการค้นหาเดียวกัน ซึ่งมักจะให้ผู้ใช้กรองชุดรายการนี้โดยใช้เกณฑ์ที่กำหนดไว้ (ตัวอย่างเช่น แสดงชื่อโรงแรมริมชายหาด) เมื่อสามารถรวมตัวกรองเข้าด้วยกันได้โดยการเพิ่มตัวกรองเข้ามา (ตัวอย่างเช่น โรงแรมริมชายหาดและมีศูนย์ออกกำลังกาย) จำนวน URL (มุมมองของข้อมูล) ในเว็บไซต์ก็จะเพิ่มสูงขึ้น การสร้างรายชื่อโรงแรมที่แตกต่างกันเล็กน้อยเป็นจำนวนมากถือเป็นเรื่องที่ซ้ำซ้อน เนื่องจาก Googlebot ต้องการเห็นรายชื่อเพียงจำนวนเล็กน้อยที่ทำให้สามารถเข้าถึงหน้าเว็บของโรงแรมแต่ละแห่งได้ ตัวอย่างเช่น
|
พารามิเตอร์ที่ไม่เกี่ยวข้อง |
พารามิเตอร์ที่ไม่เกี่ยวข้องใน URL อาจทําให้ URL จำนวนมาก เช่น
โปรดพิจารณาใช้ไฟล์ robots.txt เพื่อบล็อก Googlebot ไม่ให้เข้าถึง URL ที่มีปัญหาเหล่านี้ |
ปัญหาเกี่ยวกับปฏิทิน |
ปฏิทินที่สร้างแบบไดนามิกอาจสร้างลิงก์ไปยังวันที่ในอนาคตหรือวันที่ที่ผ่านมาแล้วโดยไม่มีข้อจำกัดสำหรับวันที่เริ่มต้นหรือวันสิ้นสุด เช่น https://example.com/calendar.php?d=13&m=8&y=2011
หากเว็บไซต์มีปฏิทินที่ไม่จำกัด ให้เพิ่มแอตทริบิวต์ |
Relative Link ที่เสีย |
การวาง Relative Link หลักในหน้าที่ไม่ถูกต้องอาจสร้างเว้นวรรคที่ไม่มีที่สิ้นสุดหากเซิร์ฟเวอร์ไม่ตอบกลับด้วยรหัสสถานะ HTTP ที่ถูกต้องสำหรับหน้าเว็บที่ไม่มีอยู่ เช่น Relative Link หลักอย่าง <a href="../../category/stuff">...</a> ใน https://example.com/category/community/070413/html/FAQ.htm อาจพาไปยัง URL ที่ไม่มีจริง เช่น https://example.com/category/community/category/stuff
วิธีแก้ไขคือใช้ Relative URL รูทในลิงก์ (แทนการใช้ Relative URL หลัก)
|
การแก้ไขปัญหาโครงสร้าง URL ที่เกี่ยวข้องกับการ Crawl
หากคุณสังเกตเห็นว่า Google Search ทำการ Crawl URL ที่มีปัญหาเหล่านี้ เราขอแนะนําให้ทําดังนี้
- พิจารณาใช้ไฟล์ robots.txt เพื่อบล็อก Googlebot ไม่ให้เข้าถึงURL ที่มีปัญหา โดยทั่วไปแล้ว ให้พิจารณาการบล็อก URL แบบไดนามิก เช่น URL ที่ทำให้เกิดผลการค้นหาหรือมีการเว้นวรรคโดยไม่จำกัด เช่น ปฏิทิน รวมถึงฟังก์ชันการจัดเรียงและกรอง
- หากเว็บไซต์มีการไปยังส่วนต่างๆ ตามข้อมูลประกอบ โปรดดูวิธีจัดการการ Crawl ของ URL การไปยังส่วนต่างๆ ตามข้อมูลประกอบเหล่านั้น