Các phương pháp hay nhất về cấu trúc URL dành cho Google Tìm kiếm
Để đảm bảo Google Tìm kiếm có thể thu thập thông tin trang web của bạn một cách hiệu quả, hãy sử dụng cấu trúc URL có thể thu thập thông tin và đáp ứng các yêu cầu sau. Nếu URL của bạn không đáp ứng các tiêu chí sau đây, thì có thể Google Tìm kiếm sẽ thu thập thông tin trang web của bạn không hiệu quả, bao gồm nhưng không giới hạn ở thu thập thông tin với tốc độ cực cao hoặc không thu thập thông tin.
Yêu cầu đối với cấu trúc URL có thể thu thập thông tin | |||||||
---|---|---|---|---|---|---|---|
Tuân theo IETF STD 66 |
Google Tìm kiếm hỗ trợ URL theo định nghĩa trong IETF STD 66. Các ký tự được xác định là đặt trước theo tiêu chuẩn này phải được mã hoá bằng phần trăm. |
||||||
Đừng sử dụng phân mảnh của URL để thay đổi nội dung |
Không dùng phân mảnh để thay đổi nội dung của một trang, vì Google Tìm kiếm thường không hỗ trợ các phân mảnh của URL. Sau đây là ví dụ về một phân mảnh của URL: https://example.com/#/potatoes Nếu đang dùng JavaScript để thay đổi nội dung, hãy chuyển sang dùng API Nhật ký. |
||||||
Sử dụng một phương thức mã hoá phổ biến đối với các tham số URL |
Khi chỉ định tham số URL, hãy sử dụng các phương pháp mã hoá phổ biến sau: dấu bằng
(
|
Giúp người dùng dễ hiểu cấu trúc URL của bạn
Để giúp Google Tìm kiếm (và người dùng) hiểu rõ hơn về trang web của bạn, bạn nên tạo một cấu trúc URL đơn giản, áp dụng các phương pháp hay nhất sau đây khi có thể.
Các phương pháp hay nhất | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Sử dụng URL mang tính mô tả |
Khi có thể, hãy sử dụng các từ dễ đọc thay cho các mã nhận dạng dài trong URL của bạn.
|
||||||||||
Dùng ngôn ngữ của đối tượng mà bạn nhắm đến |
Dùng từ bằng ngôn ngữ của đối tượng mà bạn nhắm đến trong URL (và các từ được chuyển tự nếu có). Ví dụ: nếu đối tượng mà bạn nhắm đến tìm kiếm bằng tiếng Đức, hãy dùng các từ tiếng Đức trong URL: https://example.com/lebensmittel/pfefferminz Hoặc nếu đối tượng đối tượng mà bạn nhắm đến tìm kiếm bằng tiếng Nhật, hãy dùng các từ tiếng Nhật trong URL: https://example.com/ペパーミント |
||||||||||
Sử dụng phương thức mã hoá UTF-8 nếu cần |
Khi liên kết đến các trang trên trang web, nếu cần thì hãy sử dụng phương thức mã hoá UTF-8 trong thuộc tính
|
||||||||||
Dùng dấu gạch nối để phân tách các từ |
Bạn nên tách các từ trong URL nếu có thể. Cụ thể, bạn nên dùng dấu gạch nối (
|
||||||||||
Dùng ít tham số nhất có thể |
Bất cứ khi nào có thể, hãy rút ngắn URL bằng cách cắt bớt những tham số không cần thiết (nghĩa là những tham số không thay đổi nội dung). | ||||||||||
Xin lưu ý rằng URL có phân biệt chữ hoa chữ thường |
Giống như mọi máy khách HTTP khác tuân theo IETF STD 66, Google Tìm kiếm sẽ xử lý URL theo cách thức có phân biệt chữ hoa chữ thường (ví dụ: Google xem cả /APPLE và /apple là các URL riêng biệt với nội dung riêng). Nếu máy chủ web xử lý loại chữ hoa và chữ thường
như nhau trong một URL, hãy chuyển đổi toàn bộ văn bản thành cùng một loại chữ để Google dễ dàng
xác định những URL dẫn chiếu đến cùng một trang.
|
||||||||||
Đối với trang web đa khu vực |
Nếu trang web của bạn nhắm đến nhiều khu vực, hãy cân nhắc sử dụng một cấu trúc URL giúp bạn dễ dàng nhắm mục tiêu trang web theo địa lý. Để xem thêm ví dụ về cấu trúc URL, hãy tham khảo nội dung sử dụng URL theo khu vực. Nên (sử dụng miền theo quốc gia cụ thể): https://example.de Nên (sử dụng thư mục con theo quốc gia cụ thể với miền cấp cao nhất dùng chung): https://example.com/de/ |
Tránh các vấn đề thường gặp liên quan đến URL
Các URL quá phức tạp, đặc biệt là URL chứa nhiều tham số, có thể gây ra vấn đề cho các trình thu thập thông tin. Lý do là các tham số này có thể tạo ra một số lượng lớn URL dư thừa trỏ đến nội dung giống nhau hoặc tương tự nhau trên trang web. Hậu quả là Googlebot có thể tốn nhiều băng thông hơn mức cần thiết, hoặc không thể lập chỉ mục hoàn chỉnh cho toàn bộ nội dung trên trang web.
Một số sự cố có thể dẫn đến một số lượng lớn các URL không cần thiết. Trong số các sự cố này có:
Các vấn đề thường gặp | |
---|---|
Bộ lọc bổ sung cho một nhóm mặt hàng |
Nhiều trang web cung cấp các chế độ xem khác nhau cho cùng một nhóm mặt hàng hoặc kết quả tìm kiếm. Thường thì những trang web đó cho phép người dùng lọc nhóm này bằng các tiêu chí định sẵn (ví dụ: cho tôi xem các khách sạn trên bãi biển). Khi có thể kết hợp các bộ lọc theo kiểu bổ sung (ví dụ: các khách sạn trên bãi biển và có phòng tập thể dục) thì số lượng URL (chế độ xem dữ liệu) trong trang web sẽ tăng lên rất nhiều. Việc tạo một số lượng lớn các danh sách khách sạn chỉ khác nhau đôi chút là không cần thiết, vì Googlebot chỉ cần xem một số lượng nhỏ danh sách đủ để từ đó truy cập trang của từng khách sạn. Ví dụ:
|
Tham số không liên quan |
Tham số không liên quan trong URL có thể tạo ra một số lượng lớn URL, chẳng hạn như:
Cân nhắc dùng tệp robots.txt để chặn Googlebot truy cập vào những URL gặp phải vấn đề này. |
Vấn đề liên quan đến lịch |
Lịch tạo theo phương thức động có thể tạo ra các đường liên kết đến những ngày trong tương lai hoặc quá khứ mà không có giới hạn ngày bắt đầu hoặc ngày kết thúc. Ví dụ: https://example.com/calendar.php?d=13&m=8&y=2011
Nếu trang web của bạn có lịch vô hạn, hãy thêm thuộc tính |
Đường liên kết tương đối bị lỗi |
Việc đặt đường liên kết tương đối với phần tử mẹ trên nhầm trang có thể tạo ra khoảng trắng vô hạn nếu máy chủ của bạn không phản hồi bằng mã trạng thái HTTP phù hợp đối với các trang không tồn tại. Ví dụ: đường liên kết tương đối với phần tử mẹ như <a href="../../category/stuff">...</a> trên https://example.com/category/community/070413/html/FAQ.htm có thể dẫn đến các URL giả mạo như https://example.com/category/community/category/stuff .
Để khắc phục, hãy sử dụng URL tương đối với phần tử gốc trong các đường liên kết (thay vì đường liên kết tương đối với phần tử mẹ).
|
Khắc phục các vấn đề về cấu trúc URL liên quan đến hoạt động thu thập thông tin
Nếu nhận thấy Google Tìm kiếm đang thu thập thông tin các URL gặp phải vấn đề này, bạn nên làm như sau:
- Cân nhắc sử dụng tệp robots.txt để chặn Googlebot truy cập vào URL có vấn đề. Thường thì bạn nên chặn các URL động (chẳng hạn như các URL tạo kết quả tìm kiếm hoặc URL tạo khoảng trống vô hạn, chẳng hạn như lịch), cũng như các hàm sắp xếp và lọc.
- Nếu trang web của bạn có thành phần điều hướng đa chiều, hãy tìm hiểu cách quản lý hoạt động thu thập thông tin của các URL điều hướng đa chiều đó.