Chỉ định trang chuẩn của bạn

Thứ Hai, 25 tháng 9, 2017

Bạn có thể quên bất kỳ lo lắng nào về nội dung trùng lặp đi: bây giờ chúng tôi đã hỗ trợ một định dạng cho phép bạn chỉ định công khai phiên bản ưu tiên của một URL. Nếu trang web của bạn có nội dung giống hệt hoặc tương tự nhau mà có thể truy cập được qua nhiều URL, thì định dạng này sẽ cung cấp cho bạn quyền kiểm soát lớn hơn về URL được trả lại trong kết quả tìm kiếm. Định dạng này cũng giúp đảm bảo rằng các thuộc tính như độ phổ biến của liên kết được tổng hợp cho phiên bản ưu tiên của bạn.

Hãy lấy một ví dụ cũ về một trang web bán Swedish fish. Tưởng tượng rằng phiên bản ưu tiên của URL của bạn và nội dung trên URL là như thế này:

https://www.example.com/product.php?item=swedish-fish

Tuy nhiên, người dùng (và Googlebot) có thể truy cập Swedish fish qua nhiều URL (không đơn giản như thế). Ngay cả khi thông tin chính trên các URL này giống với phiên bản ưu tiên của bạn, chúng vẫn có thể hiển thị nội dung hơi khác do các yếu tố như thông số sắp xếp hay điều hướng danh mục:

https://www.example.com/product.php?item=swedish-fish&category=gummy-candy

Hoặc chúng có nội dung hoàn toàn giống nhau, nhưng URL khác nhau do các yếu tố như thông số theo dõi hay session ID:

https://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678

Giờ bạn có thể chỉ cần thêm thẻ <link> này để chỉ định phiên bản ưu tiên của mình:

<link rel="canonical" href="https://www.example.com/product.php?item=swedish-fish" />

trong phần <head> của URL nội dung trùng lặp:

https://www.example.com/product.php?item=swedish-fish&category=gummy-candy
https://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678

và Google sẽ hiển rằng các trang trùng lặp đều tham chiếu đến URL chuẩn: https://www.example.com/product.php?item=swedish-fish. Các thuộc tính URL bổ sung, như PageRank và tín hiệu liên quan, cũng được chuyển đi.

Tiêu chuẩn này có thể được bất kỳ công cụ tìm kiếm nào áp dụng khi thu thập dữ liệu và lập chỉ mục trang web của bạn. Dĩ nhiên bạn có thể có các câu hỏi khác. Joachim Kupke, một kỹ sư từ nhóm Lập chỉ mục của chúng tôi, có mặt ở đây để cung cấp cho chúng tôi câu trả lời:

rel="canonical" là gợi ý hay lệnh?

Đó là một gợi ý mà chúng tôi thường tuân theo. Chúng tôi sẽ xem xét tùy chọn của bạn, cùng với các tín hiệu khác, khi tính toán trang phù hợp nhất để hiển trị trong kết quả tìm kiếm.

Có, đường dẫn tương đối được nhận dạng như dự kiến với thẻ <link>. Ngoài ra, nếu bạn bao gồm liên kết <base> trong tài liệu của mình, thì đường dẫn tương đối sẽ phân giải theo URL gốc.

Liệu có được không nếu trang chuẩn không phải là phiên bản trùng lặp chính xác của nội dung?

Chúng tôi cho phép có khác biệt nhỏ, ví dụ như khác biệt về thứ tự sắp xếp của bảng sản phẩm. Chúng tôi cũng nhận thức được rằng chúng tôi có thể thu thập dữ liệu trang chuẩn và trang trùng lặp vào các thời điểm khác nhau, vì thế đôi khi chúng tôi có thể thấy các phiên bản khác nhau của nội dung. Tất cả những điều này đều ổn với chúng tôi.

Nếu rel="canonical" trả lại 404 thì sao?

Chúng tôi sẽ tiếp tục lập chỉ mục nội dung của bạn và sử dụng suy nghiệm để tìm trang chuẩn, nhưng bạn nên chỉ định URL hiện có làm trang chuẩn.

Nếu rel="canonical" chưa được lập chỉ mục thì sao?

Như tất cả nội dung công khai trên web, chúng tôi cố khám phá và thu thập dữ liệu URL chuẩn được chỉ định một cách nhanh chóng. Ngay sau khi lập chỉ mục URL, chúng tôi sẽ ngay lập tức xem lại gợi ý rel="canonical".

rel="canonical" có thể là chuyển hướng không?

Có, bạn có thể chỉ định một URL chuyển hướng là URL chuẩn. Khi đó Google sẽ xử lý chuyển hướng như bình thường và cố lập chỉ mục URL này.

Nếu tôi có các chỉ định rel="canonical" trái ngược nhau thì sao?

Thuật toán của chúng tôi rất rộng: Chúng tôi có thể theo chuỗi chuẩn, nhưng bạn nên cập nhật liên kết để trỏ đến một trang chuẩn duy nhất nhằm đảm bảo kết quả chuẩn hóa tối ưu.

Có thể sử dụng thẻ liên kết này để gợi ý URL chuẩn trên một miền khác hoàn toàn không?

Câu trả lời trước đây:

Không. Để di chuyển đến một miền khác hoàn toàn, chuyển hướng (301) thường trực sẽ phù hợp hơn. Hiện tại, Google sẽ đưa các đề xuất chuẩn hóa vào tài khoản trên các miền phụ (hoặc trong một miền), chứ không phải trên nhiều miền. Vì thế chủ sở hữu trang web có thể gợi ý www.example.com so với example.com so với help.example.com, nhưng không phải example.com so với example-widgets.com.

Nghe rất tuyệt—tôi có thể xem một ví dụ thực không?

Có, wikia.com là một trang kiểm tra đáng tin cậy cho chúng ta. Ví dụ: bạn sẽ nhận thấy rằng mã nguồn trên URL https://starwars.wikia.com/wiki/Nelvana_Limited chỉ định rel="canonical" là: https://starwars.wikia.com/wiki/Nelvana.

Hai URL gần như giống hệt nhau, ngoại trừ việc Nelvana_Limited, URL đầu tiên, có chứa một thông báo ngắn gần tiêu đề. Đây là một ví dụ tốt về cách sử dụng tính năng này. Với rel="canonical", các thuộc tính của hai URL được hợp nhất trong chỉ mục của chúng tôi và kết quả tìm kiếm hiển thị phiên bản chủ định của wikia.com.

Đừng ngại đặt thêm câu hỏi trong phần bình luận dưới đây của chúng tôi. Và nếu bạn không thể triển khai liên kết chuẩn, không cần lo lắng; chúng tôi vẫn sẽ cố hết sức để chọn ra phiên bản ưu tiên trong số các URL nội dung trùng lặp của bạn và chuyển các thuộc tính liên kết, giống như lúc trước.

Cập nhật: thẻ liên kết này hiện cũng được Ask.com, Microsoft Live SearchYahoo! hỗ trợ.

Cập nhật: để biết thêm thông tin, hãy xem các bài viết trong Trung tâm trợ giúp của chúng tôi về chuẩn hóarel=canonical.