Tránh tạo nội dung trùng lặp

Nội dung trùng lặp thường đề cập đến các khối nội dung thực trong một hoặc trên nhiều miền, hoàn toàn khớp hoặc rất giống với nội dung khác. Hầu như, về nguyên gốc, đây không phải nội dung giả mạo. Ví dụ về nội dung trùng lặp không gây hại có thể bao gồm:

 • Các diễn đàn thảo luận có thể tạo cả trang thông thường và trang cơ sở nhằm hướng đến các thiết bị di động
 • Các mục lưu trữ được hiển thị hoặc được liên kết thông qua nhiều URL riêng biệt
 • Các phiên bản trang web chỉ dành cho máy in

Nếu trang web của bạn chứa nhiều trang có nội dung giống hệt nhau, có nhiều cách để bạn có thể chỉ cho Google biết URL ưu tiên của bạn. (Việc này được gọi là "chuẩn hoá".) Thêm thông tin về quá trình chuẩn hóa.

Tuy nhiên, trong một số trường hợp, nội dung bị trùng lặp trên toàn miền có chủ tâm nhằm thao túng khả năng xếp hạng của công cụ tìm kiếm hoặc để đạt được nhiều lưu lượng truy cập hơn. Những hành động giả mạo như vậy có thể dẫn đến việc không thoả mãn người dùng khi một khách truy cập xem được nội dung, về cơ bản, là giống nhau được lặp lại trong một loạt kết quả tìm kiếm.

Google đang nỗ lực để lập chỉ mục và hiển thị các trang với thông tin riêng biệt. Quá trình lọc này nghĩa là, chẳng hạn, nếu trang web của bạn có phiên bản "thông thường" và "in" cho mỗi bài viết và không phiên bản nào trong số này bị chặn bởi thẻ meta ngăn lập chỉ mục, chúng tôi sẽ chọn một phiên bản để liệt kê. Trong một số ít trường hợp mà Google nhận thấy rằng nội dung trùng lặp có thể được hiển thị với mục đích thao túng khả năng xếp hạng của chúng tôi và lừa gạt người dùng, chúng tôi cũng sẽ thực hiện những điều chỉnh phù hợp trong quá trình lập chỉ mục và xếp hạng các trang web có liên quan. Kết quả là, xếp hạng của trang web có thể bị ảnh hưởng hoặc trang web hoàn toàn có thể bị xoá khỏi chỉ mục của Google. Trong trường hợp đó, trang web sẽ không còn xuất hiện trong kết quả tìm kiếm.

Bạn có thể giải quyết trước vấn đề về nội dung trùng lặp theo một số bước và đảm bảo rằng khách truy cập sẽ xem được nội dung mà bạn muốn họ xem.

 • Sử dụng lệnh chuyển hướng 301: Nếu bạn đã cấu trúc lại trang web của mình, hãy sử dụng lệnh chuyển hướng 301 ("RedirectPermanent") trong tệp .htaccess để chuyển hướng người dùng, Googlebot và các trình thu thập dữ liệu khác theo cách thích hợp. (Trong Apache, bạn có thể thực hiện điều này bằng một tệp .htaccess; trong IIS, bạn có thể thực hiện điều này thông qua bảng điều khiển quản trị.)
 • Sử dụng các đường liên kết thống nhất: Hãy cố sử dụng các đường liên kết nội bộ thống nhất. Ví dụ: đừng liên kết đến http://www.example.com/page/, http://www.example.com/pagehttp://www.example.com/page/index.htm.
 • Sử dụng miền cấp cao nhất: Để giúp chúng tôi cung cấp phiên bản phù hợp nhất cho một tài liệu, hãy sử dụng các miền cấp cao nhất bất cứ khi nào có thể để quản lý nội dung dành riêng cho từng quốc gia. Ví dụ: chúng tôi có nhiều khả năng biết rằng http://www.example.de chứa nội dung tập trung vào Đức hơn là http://www.example.com/de hoặc http://de.example.com.
 • Thận trọng khi phân phối nội dung: Nếu bạn phân phối nội dung của mình cho nhiều trang web khác, Google sẽ luôn hiển thị phiên bản mà chúng tôi cho là phù hợp nhất đối với người dùng trong mỗi lượt tìm kiếm nhất định. Phiên bản này có thể là hoặc có thể không phải là phiên bản mà bạn ưu tiên. Tuy nhiên, sẽ rất hữu ích khi đảm bảo rằng mỗi trang web được bạn cung cấp nội dung đều có chứa một liên kết quay trở lại bài viết gốc của bạn. Bạn cũng có thể yêu cầu những người sử dụng tài liệu do bạn cung cấp sử dụng thẻ meta ngăn lập chỉ mục để ngăn công cụ tìm kiếm lập chỉ mục phiên bản nội dung của họ.
 • Giảm thiểu sự lặp lại mẫu trích: Ví dụ: thay vì đặt văn bản dài dòng về nội dung bản quyền ở cuối mỗi trang, hãy chèn một nội dung tổng hợp vắn tắt và sau đó liên kết tới một trang chi tiết hơn. Ngoài ra, bạn có thể sử dụng công cụ Xử lý tham số để xác định cách bạn muốn Google xử lý các tham số URL.
 • Tránh xuất bản nội dung trang giữ chỗ: Người dùng không muốn nhìn thấy các trang "trống", do đó, hãy tránh trang giữ chỗ nếu có thể. Ví dụ: không được xuất bản các trang mà bạn chưa có nội dung thực. Nếu bạn đã tạo các trang giữ chỗ, hãy sử dụng thẻ meta noindex để ngăn Google lập chỉ mục các trang này.
 • Hiểu được hệ thống quản lý nội dung của bạn: Đảm bảo rằng bạn biết rõ cách thức hiển thị nội dung trên trang web của bạn. Blog, diễn đàn và các hệ thống liên quan thường hiển thị cùng nội dung theo nhiều định dạng. Ví dụ: một mục nhập blog có thể xuất hiện trên trang chủ của một blog, trong một trang lưu trữ và trong một trang có những mục nhập khác với cùng nhãn.
 • Giảm thiểu nội dung tương tự nhau: Nếu bạn có nhiều trang tương tự nhau, hãy cân nhắc việc mở rộng mỗi trang hoặc hợp nhất các trang thành một. Ví dụ: nếu bạn có một trang web du lịch với các trang riêng biệt cho hai thành phố nhưng trên hai trang lại có cùng thông tin, bạn có thể nhập hai trang này thành một trang giới thiệu về cả hai thành phố hoặc bạn có thể mở rộng mỗi trang để nó có chứa nội dung duy nhất về mỗi thành phố.

Google không khuyến nghị việc chặn truy cập của trình thu thập dữ liệu vào nội dung trùng lặp trên trang web của bạn, bằng tệp robots.txt hay bằng các phương pháp khác. Nếu không thể thu thập dữ liệu các trang có nội dung trùng lặp, các công cụ tìm kiếm không thể tự động phát hiện được rằng các URL này trỏ đến cùng một nội dung và vì thế sẽ phải xem các URL này là các trang riêng biệt. Một giải pháp hay hơn là cho phép các công cụ tìm kiếm thu thập dữ liệu các URL này, nhưng đánh dấu các URL là bản sao bằng cách sử dụng phần tử liên kết rel="canonical", công cụ xử lý tham số URL hoặc lệnh chuyển hướng 301. Trong trường hợp nội dung trùng lặp khiến chúng tôi thu thập quá nhiều dữ liệu trên trang web của bạn, bạn cũng có thể điều chỉnh tùy chọn cài đặt về tốc độ thu thập dữ liệu trong Search Console.

Nội dung trùng lặp trên một trang web không phải là lý do để can thiệp vào trang web đó trừ khi mục đích rõ ràng của nội dung trùng lặp là để giả mạo và thao túng kết quả của công cụ tìm kiếm. Nếu trang web của bạn gặp phải vấn đề về nội dung trùng lặp và bạn không thực hiện theo tư vấn ở trên, chúng tôi sẽ chọn một phiên bản nội dung để hiển thị trong kết quả tìm kiếm của chúng tôi.

Tuy nhiên, nếu bài đánh giá của chúng tôi cho thấy rằng bạn đã tạo những ứng dụng giả mạo và trang web của bạn đã bị xoá khỏi kết quả tìm kiếm của chúng tôi, hãy xem lại trang web của bạn cẩn thận. Nếu trang web của bạn đã bị xóa khỏi kết quả tìm kiếm của chúng tôi, hãy xem Nguyên tắc quản trị trang web của chúng tôi để biết thêm thông tin. Khi bạn đã thực hiện thay đổi và tin rằng trang web của bạn không còn vi phạm nguyên tắc của chúng tôi, hãy gửi trang web của bạn để chúng tôi xem xét lại.

Trong các trường hợp hiếm gặp, thuật toán của chúng tôi có thể chọn một URL từ trang web bên ngoài đang lưu trữ nội dung của bạn mà không được bạn cho phép. Nếu tin rằng một trang web khác đang sao chép nội dung của bạn theo cách vi phạm luật bản quyền, bạn có thể liên hệ với nhà cung cấp dịch vụ lưu trữ của trang web đó để yêu cầu xóa nội dung. Ngoài ra, bạn có thể yêu cầu Google xóa trang vi phạm khỏi kết quả tìm kiếm của chúng tôi bằng cách gửi yêu cầu theo Đạo luật Bản quyền Kỹ thuật số Thiên niên kỷ.