Giải thích về tính năng xoá URL, Phần III: Xoá nội dung mà bạn không sở hữu

Thứ Ba, ngày 20 tháng 4 năm 2010

Chào mừng bạn đến với tập thứ ba trong loạt video của chúng tôi về việc xoá URL! Trong hai tập đầu, chúng ta đã nói về việc đẩy nhanh quá trình xoá nội dung thuộc quyền kiểm soát của bạn cũng như đẩy nhanh quá trình xoá nội dung trong bộ nhớ đệm. Hôm nay, chúng tôi sẽ đề cập đến cách sử dụng công cụ xoá URL công khai của Google để yêu cầu xoá nội dung khỏi kết quả tìm kiếm của Google khi nội dung đó bắt nguồn từ một trang web không thuộc quyền kiểm soát của bạn.

Google cung cấp hai công cụ để yêu cầu xoá nhanh nội dung:

  1. Công cụ xoá URL đã xác minh: để yêu cầu xoá nội dung khỏi kết quả tìm kiếm trên Google khi nội dung đó được xuất bản trên một trang web mà bạn là chủ sở hữu đã xác minh trong Công cụ quản trị trang web (chẳng hạn như blog hoặc trang web của công ty bạn)
  2. Công cụ xoá URL công khai: để yêu cầu xoá nội dung khỏi kết quả tìm kiếm của Google khi nội dung đó được xuất bản trên một trang web mà bạn không xác minh được quyền sở hữu (chẳng hạn như blog của bạn bè)

Trong một số trường hợp, thông tin bạn muốn xoá bắt nguồn từ một trang web mà bạn không sở hữu hoặc không thể kiểm soát. Vì mỗi quản trị viên trang web kiểm soát trang web cũng như nội dung trang web của họ, cách tốt nhất để cập nhật hoặc xoá kết quả khỏi Google là chủ sở hữu trang web (nơi nội dung được xuất bản) chặn việc thu thập dữ liệu URL, sửa đổi nguồn nội dung hoặc xoá toàn bộ trang. Nếu nội dung không thay đổi, thì nội dung đó sẽ chỉ xuất hiện lại trong kết quả tìm kiếm vào lần tiếp theo chúng tôi thu thập dữ liệu. Vì vậy, bước đầu tiên để xoá nội dung được lưu trữ trên một trang web mà bạn không sở hữu là liên hệ với chủ sở hữu của trang web đó để yêu cầu họ xoá hoặc chặn nội dung liên quan.

Nội dung bị xoá hoặc bị chặn

Nếu chủ sở hữu trang web xoá một trang, các yêu cầu đối với trang đã xoá sẽ trả về phản hồi 404 Not Found hoặc phản hồi 410 Gone. Nếu người dùng chọn chặn trang khỏi các công cụ tìm kiếm, thì trang đó sẽ không được phép truy cập do quy tắc trong tệp robots.txt của trang web hoặc chứa thẻ noindex meta. Khi một trong những yêu cầu này được đáp ứng, bạn có thể gửi yêu cầu xoá bằng cách sử dụng tuỳ chọn "Quản trị viên trang web đã chặn trang".

công cụ xoá url của google

Đôi khi, chủ sở hữu trang web tuyên bố rằng họ đã chặn hoặc xoá một trang nhưng về mặt kỹ thuật thì họ chưa thực hiện việc này. Nếu họ cho rằng một trang đã được chặn, bạn có thể kiểm tra kỹ bằng cách xem tệp robots.txt của trang web để xem liệu trang đó có được chặn hay không.

User-agent: *
Disallow: /blocked-page/

Bạn cũng có thể kiểm tra trong mã nguồn HTML của trang để biết trang có được chặn hay không. Bạn có thể truy cập trang này rồi chọn "Xem nguồn trang" trên trình duyệt. Có thẻ meta noindex trong phần head trong mã HTML không?

<html>
<head>
<title>blocked page</title>
<meta name="robots" content="noindex">
</head>
...

Nếu họ thông báo rằng trang đã bị xoá, bạn có thể xác nhận điều này bằng cách sử dụng một công cụ kiểm tra phản hồi HTTP như tiện ích bổ sung Tiêu đề HTTP trực tiếp trên trình duyệt Firefox. Khi bật tiện ích bổ sung này, bạn có thể yêu cầu bất kỳ URL nào trong Firefox để kiểm tra xem phản hồi HTTP có thực sự là 404 Not Found hoặc 410 Gone không.

Nội dung đã xoá khỏi trang

Sau khi xác nhận rằng nội dung mà bạn muốn xoá không còn xuất hiện trên trang này, bạn có thể yêu cầu xoá bộ nhớ đệm bằng cách dùng tuỳ chọn "Nội dung đã bị xoá khỏi trang này". Hình thức xoá này (thường được gọi là xoá "bộ nhớ đệm") đảm bảo rằng kết quả tìm kiếm trên Google sẽ không chứa bản sao hay phiên bản lưu trong bộ nhớ đệm của trang cũ hoặc đoạn trích văn bản từ phiên bản cũ của trang. Chỉ trang được cập nhật hiện tại (không có nội dung đã bị xoá) mới có thể truy cập được qua kết quả tìm kiếm trên Google. Tuy nhiên, trang hiện tại vẫn có thể được xếp hạng cho những cụm từ liên quan đến nội dung cũ do những đường liên kết đến trang vẫn tồn tại qua các trang web bên ngoài. Đối với các yêu cầu xoá bộ nhớ đệm, bạn sẽ được yêu cầu nhập "cụm từ đã bị xoá khỏi trang". Hãy nhớ nhập một từ không có trên trang đang hoạt động để quy trình tự động của chúng tôi có thể xác nhận rằng trang đó đã thay đổi. Nếu không, yêu cầu sẽ bị từ chối. Bạn có thể xem thêm thông tin chi tiết về việc xoá bộ nhớ đệm trong phần hai của loạt nội dung "Giải thích về tính năng xoá URL".

công cụ xoá nội dung trong bộ nhớ đệm của google

Xoá các trang web hoặc hình ảnh không phù hợp xuất hiện trong kết quả lọc bằng tính năng Tìm kiếm an toàn

Google đã ra mắt bộ lọc Tìm kiếm an toàn với mục tiêu cung cấp những kết quả tìm kiếm có khả năng loại trừ nội dung có thể gây phản cảm. Đối với những trường hợp mà bạn thấy nội dung mà bạn cảm thấy đáng ra phải bị tính năng Tìm kiếm an toàn lọc bỏ, bạn có thể yêu cầu xoá nội dung đó khỏi kết quả đã lọc bằng tính năng Tìm kiếm an toàn trong tương lai. Bạn có thể gửi yêu cầu xoá bằng cách sử dụng tuỳ chọn "Nội dung không phù hợp xuất hiện trong kết quả đã lọc của tính năng Tìm kiếm an toàn".

công cụ xoá nội dung tìm kiếm an toàn của google

Nếu bạn gặp vấn đề với công cụ xoá URL công khai hoặc có thắc mắc chưa được giải quyết tại đây, vui lòng đăng vấn đề đó lên Diễn đàn trợ giúp dành cho Quản trị viên trang web hoặc tham khảo hướng dẫn xoá chi tiết trong Trung tâm trợ giúp của chúng tôi. Nếu bạn đăng bài lên diễn đàn, hãy nhớ dùng dịch vụ rút ngắn URL để chia sẻ mọi đường liên kết đến nội dung mà bạn muốn xoá.

Cuối cùng, bạn cũng có thể tìm hiểu về cách quản lý những thông tin hiện có về bạn trên mạng.