Kiến thức cơ bản về cách thức hoạt động của Tìm kiếm

Google là một công cụ tìm kiếm hoàn toàn tự động. Google sử dụng những phần mềm được gọi là trình thu thập dữ liệu web có chức năng thường xuyên khám phá trên web nhằm tìm các trang web để thêm vào chỉ mục của chúng tôi. Trên thực tế, rất ít trang web xuất hiện trong các kết quả tìm kiếm của chúng tôi là do được gửi theo cách thủ công. Phần lớn các trang web được tự động tìm thấy và thêm vào kết quả khi trình thu thập dữ liệu web của chúng tôi thu thập dữ liệu trên web.

Google Tìm kiếm hoạt động theo ba giai đoạn cơ bản:

  • Thu thập dữ liệu: Google sử dụng các chương trình tự động (gọi là trình thu thập dữ liệu) để tìm kiếm các trang mới hoặc vừa cập nhật trên web. Google lưu trữ địa chỉ của những trang đó (hay URL của trang) trong một danh sách lớn để sau này xem lại. Chúng tôi dùng nhiều phương pháp để tìm trang, nhưng phương pháp chính là đi theo các đường liên kết trên những trang mà chúng tôi đã biết.
  • Lập chỉ mục: Google truy cập các trang đã biết bằng cách thu thập dữ liệu và cố gắng phân tích nội dung trên mỗi trang. Google phân tích nội dung, hình ảnh và các tệp video trên mỗi trang để nắm được nội dung của trang đó. Thông tin này được lưu trữ trong Chỉ mục của Google, một cơ sở dữ liệu khổng lồ được lưu trữ trên nhiều máy tính.
  • Phân phát kết quả tìm kiếm: Khi người dùng tìm kiếm trên Google, Google sẽ cố gắng xác định những kết quả có chất lượng cao nhất. Kết quả "tốt nhất" phụ thuộc vào nhiều yếu tố, trong đó có vị trí, ngôn ngữ, thiết bị của người dùng (máy tính hoặc điện thoại) và những cụm từ họ từng tìm kiếm. Ví dụ: khi tìm kiếm cùng một cụm từ là "cửa hàng sửa xe đạp", người dùng ở Paris và người dùng ở Hong Kong sẽ nhận được những câu trả lời khác nhau. Google không nhận tiền để tăng thứ hạng của trang. Việc xếp hạng là do thuật toán thực hiện.

Nếu quan tâm, bạn có thể tham khảo thêm chút thông tin về cách thức hoạt động của Tìm kiếm. Cũng có một phiên bản dài hơn nữa về cách thức hoạt động của Google Tìm kiếm.