Gạch chéo hay không gạch chéo

Thứ Tư, ngày 21 tháng 4 năm 2010

Đây là câu hỏi mà chúng tôi thường nhận được. Sau đây là câu trả lời! Trước đây, thường thì URL có dấu gạch chéo ở cuối dùng để thể hiện thư mục và URL không có dấu gạch chéo ở cuối dùng để thể hiện tệp:

https://example.com/foo/ (with trailing slash, conventionally a directory)
https://example.com/foo (without trailing slash, conventionally a file)

Nhưng chắc chắn là không cần làm vậy. Google xử lý từng URL ở trên một cách độc lập (và theo cách như nhau), bất kể đó là tệp hay thư mục, có dấu gạch chéo ở cuối hay không có dấu gạch chéo ở cuối.

Bạn có thể cung cấp cho Google nội dung riêng biệt giữa URL có dấu gạch chéo và URL không có dấu gạch chéo, nhưng thường thì người dùng không thích cách này

Xét về mặt kỹ thuật, chắc chắn là công cụ tìm kiếm cho phép hai phiên bản URL này chứa nội dung khác nhau. Tuy nhiên, người dùng có thể thấy cách thiết lập này khó hiểu khủng khiếp. Bạn chỉ cần hình dung trường hợp www.google.com/webmasterswww.google.com/webmasters/ tạo ra hai trải nghiệm riêng biệt.

Vì lý do này, các URL có và không có dấu gạch chéo ở cuối thường phân phát cùng một nội dung. Trường hợp phổ biến nhất là khi một trang web được định cấu hình theo cấu trúc thư mục:

https://example.com/parent-directory/child-directory/

Cấu hình của trang web và các lựa chọn của bạn

Bạn có thể nhanh chóng kiểm tra trên trang web của mình để xem một trong hai URL khớp với mẫu này có chuyển hướng đến URL còn lại hay không:

  1. https://example.com/foo/
    (có dấu gạch chéo ở cuối)
  2. https://example.com/foo
    (không có dấu gạch chéo ở cuối)
  • Nếu chỉ có thể trả về một phiên bản (tức là các phiên bản khác chuyển hướng đến phiên bản đó), thì rất tốt! Hành vi này có lợi vì nó làm giảm nội dung trùng lặp. Trong trường hợp cụ thể khi chuyển hướng đến URL có dấu gạch chéo ở cuối, có thể kết quả tìm kiếm của chúng tôi sẽ cho thấy phiên bản URL có mã phản hồi 200 (thường là URL có dấu gạch chéo ở cuối) — bất kể lệnh chuyển hướng là 301 hay 302.
  • Nếu cả phiên bản có dấu gạch chéo và phiên bản không có dấu gạch chéo ở cuối đều chứa cùng nội dung và đều trả về 200, thì bạn có thể:
    • Cân nhắc việc thay đổi hành vi này (xem thêm thông tin bên dưới) để giảm nội dung trùng lặp và cải thiện hiệu suất thu thập dữ liệu.
    • Giữ nguyên trạng. Nhiều trang web cũng có nội dung trùng lặp. Quy trình lập chỉ mục của chúng tôi thường xử lý trường hợp này cho quản trị viên trang web và người dùng. Tuy không phải là hành vi hoàn toàn tối ưu, nhưng nó hoàn toàn hợp lệ và không có vấn đề gì. :)
    • Hãy yên tâm rằng đối với URL gốc của bạn, https://example.com tương đương với https://example.com/ và không thể chuyển hướng ngay cả khi bạn là Chuck Norris.

Các bước để phân phát một phiên bản URL duy nhất

Trong trường hợp trang web của bạn phân phát nội dung trùng lặp trên cả hai URL này:

https://example.com/foo/
https://example.com/foo

Tức là cả hai URL đều trả về 200 (không có lệnh chuyển hướng hoặc chứa thẻ liên kết rel="canonical") và bạn muốn thay đổi tình huống này?

  1. Chọn một URL làm phiên bản ưu tiên. Nếu trang web của bạn có cấu trúc thư mục, thì bạn nên dùng dấu gạch chéo ở cuối cho URL của thư mục (ví dụ: example.com/directory/ thay vì example.com/directory), nhưng bạn có thể chọn bất kỳ cách nào tuỳ ý.
  2. Nhất quán với phiên bản ưu tiên. Hãy sử dụng cách này trong các đường liên kết nội bộ. Nếu bạn có sơ đồ trang web, hãy cung cấp phiên bản ưu tiên (và đừng cung cấp URL trùng lặp).
  3. Sử dụng lệnh chuyển hướng 301 từ phiên bản trùng lặp đến phiên bản ưu tiên. Nếu không thể thực hiện việc này, bạn nên sử dụng thẻ liên kết rel="canonical". rel="canonical" hoạt động tương tự như 301 cho hoạt động lập chỉ mục của Google và các công cụ tìm kiếm lớn khác.
  4. Kiểm tra cấu hình 301 của bạn thông qua tính năng Tìm nạp như Googlebot trong Công cụ quản trị trang web. Đảm bảo các URL https://example.com/foo/https://example.com/foo đang hoạt động như dự kiến. Phiên bản ưu tiên sẽ trả về mã trạng thái 200. URL trùng lặp phải chuyển hướng dạng 301 đến URL được ưu tiên.
  5. Kiểm tra lỗi thu thập dữ liệu trong Công cụ quản trị trang web, và nếu có thể, máy chủ web của bạn sẽ ghi lại quá trình kiểm tra nhanh để xem lệnh chuyển hướng 301 có được triển khai hay không.
  6. Hốt bạc! (đùa thôi) Nhưng bạn có thể tận hưởng cấu hình máy chủ hiệu quả này khi biết chắc rằng trang web của mình đã được tối ưu hoá theo cách tốt hơn.