Khắc phục vấn đề về chuẩn hoá

Hãy dùng Công cụ kiểm tra URL để kiểm tra xem Google chọn trang nào làm trang chính tắc. Ngay cả khi bạn đã chỉ định rõ trang chính tắc, có thể Google vẫn chọn một trang chính tắc khác vì nhiều lý do (ví dụ: do chất lượng nội dung). Trước khi khắc phục sự cố, hãy suy nghĩ xem liệu URL chính tắc do Google chọn có phù hợp hơn so với URL chính tắc mà bạn ưu tiên chọn cho người dùng trên Google Tìm kiếm hay không.

Có nhiều lý do khiến URL chính tắc do Google chọn khác với URL chính tắc mà bạn muốn thấy trong Tìm kiếm. Các vấn đề phổ biến nhất là:

Các vấn đề thường gặp về quy trình chuẩn hoá

Biến thể theo ngôn ngữ không có chú giải đã bản địa hoá

Nếu bạn có nhiều trang web phân phát cùng một nội dung đã bản địa hoá cho nhiều người dùng trên khắp thế giới, hãy đảm bảo rằng bạn tuân thủ nguyên tắc của chúng tôi đối với các trang web đã bản địa hoá. Ví dụ: nếu bạn có các trang web khác nhau cho người dùng nói tiếng Anh ở Hoa Kỳ, Vương quốc Anh và Úc, nhưng nội dung các trang web này giống nhau, thì việc thêm chú thích hreflang vào các trang có thể giúp trang phù hợp xuất hiện cho người dùng ở những khu vực khác nhau.

Phần tử trang chính tắc không chính xác

Một số hệ thống quản lý nội dung (CMS) hoặc trình bổ trợ của CMS có thể sử dụng sai kỹ thuật chuẩn hoá để trỏ đến các URL không mong muốn. Hãy kiểm tra HTML của bạn bằng công cụ cho nhà phát triển của trình duyệt để xem có phải không. Nếu trang web của bạn chỉ định một URL chính tắc mà bạn không mong muốn (có thể là do bạn dùng rel="canonical" hoặc lệnh chuyển hướng 3xx không đúng cách), hãy liên hệ với nhà cung cấp CMS của bạn để báo cáo lỗi này cho họ.

Máy chủ bị định cấu hình không chính xác

Một số lỗi về cách định cấu hình máy chủ lưu trữ có thể dẫn đến việc lựa chọn nhầm URL trên miền khác. Ví dụ:
  • Nếu bị định cấu hình không chính xác, máy chủ có thể trả về nội dung trên example.com khi phản hồi một yêu cầu cho URL trên other.example
  • Hai máy chủ web không liên quan đến nhau có thể trả về các trang soft 404 giống hệt nhau mà Google không xác định được là trang lỗi. Nếu phát hiện vấn đề này, hãy liên hệ với nhà cung cấp dịch vụ lưu trữ của bạn.

Bị tấn công bằng mã độc

Một số cuộc tấn công vào trang web sẽ chèn mã trả về lệnh chuyển hướng 3xx của HTTP, hoặc chèn chú thích rel="canonical" link cho nhiều miền vào HTML <head> hoặc tiêu đề HTTP, thường là trỏ đến một URL lưu trữ nội dung rác/độc hại. Trong các trường hợp này, thuật toán của chúng tôi có thể chọn URL lưu trữ nội dung rác/độc hại thay vì chọn URL trên trang web bị tấn công.

Nội dung tổng hợp

Đối với những đối tác tổng hợp muốn tránh trùng lặp thì không nên dùng yếu tố liên kết chính tắc, do những trang đó thường rất khác nhau. Giải pháp hiệu quả nhất là các đối tác đó nên chặn không cho lập chỉ mục nội dung của bạn. Để tìm hiểu thêm, hãy xem bài viết Tránh trùng lặp bài viết trong Google News. Bài viết này cũng có lời khuyên về cách chặn nội dung tổng hợp khỏi Google Tìm kiếm.

Trang web sao chép trái phép

Trong một số trường hợp hiếm gặp, thuật toán của chúng tôi có thể chọn URL trên một trang web bên ngoài đang lưu trữ nội dung của bạn mà không được bạn cho phép. Nếu bạn cho rằng có một trang web khác đang sao chép nội dung của mình theo cách vi phạm luật bản quyền, bạn có thể liên hệ với nhà cung cấp dịch vụ lưu trữ của trang web đó để yêu cầu xoá nội dung đó. Ngoài ra, bạn có thể yêu cầu Google xoá trang vi phạm khỏi phần kết quả tìm kiếm bằng cách gửi một yêu cầu theo Đạo luật bản quyền kỹ thuật số thiên niên kỷ.

Xin lưu ý rằng nếu URL chính tắc nằm trong tài sản mà bạn không sở hữu trong Search Console, thì bạn sẽ không thể thấy lưu lượng truy cập nào cho trang trùng lặp của mình.