Ngăn nội dung vi phạm lợi dụng một vài phần trên trang web của bạn

Thứ Tư, ngày 26 tháng 5 năm 2021

Là chủ sở hữu trang web, bạn có thể cung cấp một số kênh cho người dùng tương tác, chẳng hạn như diễn đàn, sổ lưu bút, nền tảng mạng xã hội, trình tải tệp lên, dịch vụ lưu trữ hoặc dịch vụ tìm kiếm nội bộ. Những dịch vụ này giúp người dùng tạo tài khoản để đăng nội dung, tải tệp lên hoặc tìm kiếm trên trang web của bạn. Nhưng đáng tiếc là có những kẻ thường lợi dụng những loại dịch vụ này để tạo ra hàng trăm trang vi phạm, mang lại rất ít hoặc không một chút giá trị nào trên web. Theo các quy tắc trong Nguyên tắc quản trị trang web của Google, hành vi này có thể dẫn đến việc Google thực hiện các hình phạt thủ công đối với những trang bị ảnh hưởng. Sau đây là một số ví dụ:

Diễn đàn/sổ lưu bút bị lợi dụng Trình tải tệp lên bị lợi dụng bằng tệp PDF vi phạm Dịch vụ lưu trữ bị lợi dụng Kết quả tìm kiếm nội bộ bị lợi dụng

Nội dung vi phạm như trên có thể gây hại cho người dùng và trang web của bạn theo nhiều cách:

  • Nội dung chất lượng thấp trên một số phần của trang web có thể ảnh hưởng đến thứ hạng của toàn bộ trang web.
  • Nội dung vi phạm có khả năng dẫn người dùng đến nội dung không mong muốn hoặc thậm chí gây hại, chẳng hạn như các trang web chứa phần mềm độc hại hoặc lừa đảo. Việc này có thể khiến trang web của bạn bị giảm uy tín.
  • Lưu lượng truy cập ngoài ý muốn từ nội dung không liên quan trên trang web có thể làm giảm tốc độ truy cập và tăng chi phí lưu trữ.
  • Để bảo vệ chất lượng của kết quả tìm kiếm, Google có thể xoá hoặc giáng thứ hạng những trang chứa quá nhiều nội dung vi phạm do bên thứ ba tạo ra.

Trong bài đăng này, chúng tôi sẽ chia sẻ một số mẹo nhằm ngăn những kẻ vi phạm lợi dụng trang web của bạn.

Chặn hành vi tạo tài khoản tự động

Khi người dùng tạo tài khoản trên trang web của bạn, hãy cân nhắc sử dụng dịch vụ hình ảnh xác thực (CAPTCHA) của Google hoặc các công cụ xác minh tương tự (ví dụ: Securimage hoặc Jcaptcha) để chỉ cho phép người dùng thực gửi yêu cầu, chứ không cho các tập lệnh tự động tạo tài khoản và nội dung trên các nền tảng công khai của trang web.

Việc yêu cầu người dùng mới xác thực một địa chỉ email có thật khi đăng ký tài khoản mới cũng có thể ngăn chặn nhiều loại bot vi phạm tạo tài khoản tự động. Ngoài ra, bạn có thể thiết lập bộ lọc để chặn các địa chỉ email đáng ngờ hoặc có nguồn gốc từ những dịch vụ email mà bạn không tin tưởng.

Bật tính năng kiểm duyệt

Hãy cân nhắc bật tính năng kiểm duyệt hoạt động tạo hồ sơ và bình luận, yêu cầu người dùng phải có uy tín ở một mức nhất định thì mới có thể đăng đường liên kết. Nếu có thể, hãy thay đổi chế độ cài đặt để không cho phép đăng ẩn danh và bắt buộc bài đăng của người dùng mới phải được phê duyệt trước khi xuất hiện công khai.

Theo dõi trang web để phát hiện nội dung vi phạm và xử lý vấn đề

Hãy đăng ký và xác minh quyền sở hữu trang web trong Search Console. Để xem Google có phát hiện vấn đề nào không, hãy xem báo cáo Vấn đề bảo mậtbáo cáo Hình phạt thủ công. Bạn cũng có thể kiểm tra bảng Thông báo để biết thêm thông tin.

Thông báo trong Search Console về một trang web bị lợi dụng bằng nội dung của bên thứ ba

Ngoài ra, bạn nên thỉnh thoảng kiểm tra trang web để phát hiện nội dung không mong muốn hoặc nội dung vi phạm bằng cách dùng toán tử site: trên Google Tìm kiếm, kèm theo các từ khoá về nội dung quảng cáo hay nội dung người lớn không liên quan đến chủ đề trên trang web. Ví dụ: tìm kiếm theo cụm từ [site:your-domain-name viagra] hoặc [site:your-domain-name watch online] để phát hiện nội dung không liên quan trên trang web của bạn, đặc biệt là:

  • Văn bản không có ngữ cảnh hoặc đường liên kết lạc đề với mục đích duy nhất là quảng bá trang web/dịch vụ của bên thứ ba (ví dụ: "tải/xem phim trực tuyến miễn phí")
  • Văn bản vô nghĩa hoặc được tạo tự động (không phải do người dùng viết)
  • Kết quả tìm kiếm nội bộ mà trong đó cụm từ tìm kiếm của người dùng có vẻ lạc đề và nhằm mục đích quảng bá trang web/dịch vụ của bên thứ ba

Hãy theo dõi các tệp nhật ký trên máy chủ web để phát hiện những thay đổi đột ngột về lưu lượng truy cập, đặc biệt là đối với các trang mới tạo. Ví dụ: tìm những URL mà từ khoá trong mẫu URL hoàn toàn không liên quan đến trang web của bạn. Để xác định những URL có vấn đề và có mức lưu lượng truy cập cao, hãy sử dụng Báo cáo trang trong Google Analytics.

Hãy chặn hoạt động phát hành nội dung rõ ràng không phù hợp trên nền tảng của bạn, dựa vào một danh sách từ khóa vi phạm (ví dụ: từ khóa liên quan đến nội dung tải xuống hay xem trực tuyến, nội dung người lớn, cờ bạc hoặc dược phẩm). Các trình bổ trợ hoặc tính năng tích hợp sẵn có thể giúp bạn xoá hoặc đánh dấu những nội dung như vậy là nội dung vi phạm.

Một công cụ hiệu quả khác để thực hiện việc này là Google Alerts. Hãy thiết lập cảnh báo [site:your-domain-name spammy-keywords] bằng các từ khoá về nội dung quảng cáo hoặc nội dung cho người lớn mà bạn không muốn thấy trên trang web của mình. Google Alerts cũng là một công cụ hữu hiệu để phát hiện các trang bị tin tặc tấn công.

Xác định và chấm dứt hoạt động của tài khoản vi phạm

Hãy theo dõi nhật ký máy chủ web ghi lại lượt đăng ký của người dùng và xác định các dấu hiệu vi phạm điển hình, chẳng hạn như:

  • Một lượng lớn lượt hoàn thành biểu mẫu đăng ký trong một thời gian ngắn.
  • Số lượng yêu cầu gửi từ cùng một dải địa chỉ IP.
  • Việc sử dụng tác nhân người dùng không mong muốn trong quá trình đăng ký.
  • Việc gửi tên người dùng vô nghĩa hoặc các giá trị vô nghĩa khác trong quá trình đăng ký. Ví dụ: tên người dùng chứa nội dung quảng cáo (những tên như "Tải phim miễn phí") không giống tên người thật và liên kết đến các trang web không liên quan.

Ngăn Google Tìm kiếm hiển thị hoặc theo dõi nội dung không đáng tin cậy

Nếu trang web của bạn cho phép người dùng tạo các trang như trang hồ sơ, trang web hoặc chuỗi bài đăng trong diễn đàn, thì bạn có thể ngăn chặn hành vi lợi dụng qua nội dung vi phạm bằng cách ngăn Google Tìm kiếm hiển thị hoặc theo dõi nội dung mới hoặc nội dung không đáng tin cậy.

Ví dụ: bạn có thể dùng tiêu chuẩn meta noindex để chặn quyền truy cập vào các trang không đáng tin cậy. Chẳng hạn như:

<html>
  <head>
    <meta name="googlebot" content="noindex">
  </head>
</html>

Bạn cũng có thể dùng tiêu chuẩn robots.txt để tạm thời chặn trang. Ví dụ:

Disallow: /guestbook/

Bạn cũng có thể dùng rel="ugc" hoặc rel="nofollow" để đánh dấu các đường liên kết đến nội dung do người dùng tạo (UGC), chẳng hạn như bình luận và bài đăng trên diễn đàn. Việc này giúp bạn giải thích cho Google về mối liên hệ của bạn với trang được liên kết và yêu cầu Google không đi theo đường liên kết đó.

Hợp nhất nội dung trên nền tảng mở vào một đường dẫn tệp hoặc thư mục tập trung

Khi có các tập lệnh hoặc phần mềm tự động, những kẻ vi phạm có thể tạo nhiều trang vi phạm trên trang web của bạn trong một thời gian ngắn. Một số nội dung như vậy có thể được lưu trữ trong các đường dẫn tệp hoặc thư mục phân đoạn, cản trở chủ sở hữu trang web phát hiện và loại bỏ một cách hiệu quả nội dung vi phạm. Một số ví dụ như sau:

example.com/best-online-pharma-buy-red-viagra-online
example.com/free-watch-online-2021-full-movie

Bạn cũng nên hợp nhất nội dung do người dùng tạo vào một đường dẫn tệp hoặc thư mục tập trung để bảo trì nội dung này và phát hiện nội dung vi phạm dễ dàng hơn. Chẳng hạn, bạn nên dùng đường dẫn tệp sau:

example.com/user-generated-content-dir-name/example01.html
example.com/user-generated-content-dir-name/example02.html

Luôn cập nhật phần mềm trang web và dùng các hệ thống tự động để bảo vệ trang web

Hãy dành thời gian để cập nhật phần mềm và đặc biệt chú ý đến các bản cập nhật quan trọng liên quan đến vấn đề bảo mật. Những kẻ vi phạm có thể lợi dụng vấn đề bảo mật trong các phiên bản cũ của blog, bảng tin và các hệ thống quản lý nội dung khác.

Ngoài ra, một số hệ thống toàn diện chống nội dung vi phạm như Akismet cung cấp các trình bổ trợ cho nhiều hệ thống blog và diễn đàn. Các trình bổ trợ này đều dễ cài đặt và giúp bạn thực hiện phần lớn công việc chống gian lận. Bên cạnh đó, một số trình bổ trợ nổi tiếng và đáng tin cậy về bảo mật hiện có dành cho một vài nền tảng cũng có thể giúp bạn bảo vệ trang web và sớm phát hiện các trường hợp vi phạm.

Tuỳ thuộc vào tình hình của trang web, vui lòng xem tài liệu của chúng tôi để biết thêm thông tin chi tiết:

Bạn cũng có thể truy cập Cộng đồng trợ giúp của Trung tâm Tìm kiếm khi cần trợ giúp.