Hiểu quy trình kết xuất trên Google Tìm kiếm

Googlebot sử dụng dịch vụ kết xuất web (WRS) dựa trên Chrome 41 (M41). Nói chung, WRS hỗ trợ các tính năng và khả năng của nền tảng web giống như phiên bản Chrome mà dịch vụ này sử dụng - để biết danh sách đầy đủ, hãy xem chromestatus.com hoặc sử dụng chức năng so sánh trên caniuse.com.

Tuy nhiên, có một vài ngoại lệ và điểm khác biệt mà bạn nên ghi nhớ. Tài liệu này mô tả các tính năng và API bị vô hiệu hóa hoặc hạn chế rõ ràng trong WRS.

Googlebot và WRS ưu tiên nội dung trang thiết yếu

Googlebot được thiết kế để mang lại lợi ích cho web. Googlebot có ưu tiên chính là thu thập dữ liệu mà đồng thời vẫn đảm bảo không làm giảm trải nghiệm của người dùng truy cập trang web. Googlebot và WRS liên tục phân tích và xác định các tài nguyên góp phần tạo ra nội dung trang thiết yếu và có thể sẽ không tìm nạp các tài nguyên đó. Ví dụ: các yêu cầu báo cáo và lỗi không góp phần tạo ra nội dung trang thiết yếu, và các loại yêu cầu tương tự khác không được sử dụng hoặc không cần thiết để trích xuất nội dung trang thiết yếu.

WRS vô hiệu hóa một số giao diện và khả năng

Bạn nên sử dụng chức năng phát hiện tính năng để xác định các API được hỗ trợ và khả năng của WRS và cả polyfill nếu có (giống như cách bạn sẽ làm với bất kỳ trình duyệt nào khác) vì các khả năng của WRS có thể cập nhật bất cứ lúc nào:

  • Giao diện IndexedDB và WebQuery bị vô hiệu hóa.
  • Các giao diện xác định trong phần đặc tả Trình chạy dịch vụ bị vô hiệu hóa.
  • Giao diện WebGL bị vô hiệu hóa; Nội dung 3D và VR hiện chưa được lập chỉ mục.

Googlebot và WRS không có trạng thái trong các lần tải trang

WRS tải từng URL (tham khảo phần Giới thiệu về lập chỉ mục để biết thông tin tổng quan về cách Google khám phá nội dung), theo các chuyển hướng của máy chủ và máy khách, giống như một trình duyệt thông thường. Tuy nhiên, WRS không có trạng thái trong các lần tải trang:

  • Dữ liệu Bộ nhớ cục bộ và Bộ nhớ phiên bị xóa trong các lần tải trang.
  • Cookie HTTP bị xóa trong các lần tải trang.

WRS không hỗ trợ ES6

Chrome M41 không hỗ trợ các tính năng ES6 (ví dụ: các lớp). Nếu bạn đang sử dụng ES6, hãy đảm bảo chuyển mã JavaScript của bạn thành ES5.

WRS chỉ cung cấp chức năng hỗ trợ hạn chế cho các thành phần web

Đặt nội dung của bạn vào light DOM bất cứ khi nào có thể và sử dụng shadow DOM để đóng gói và ẩn chi tiết triển khai. Nội dung thiết yếu như các phần tử điều hướng, liên kết, tiêu đề và văn bản và hình ảnh chính của bạn phải luôn nằm trong light DOM. Điều này tối đa hóa khả năng tương thích với các máy khách mà có thể không hỗ trợ các thành phần web hoặc không thực thi JavaScript.

WRS từ chối yêu cầu cấp phép

Googlebot sẽ tự động từ chối mọi tính năng cần có sự đồng ý của người dùng. Để biết danh sách đầy đủ các tính năng bị ảnh hưởng, hãy tham khảo Danh sách cấp phép. Ví dụ: API máy ảnh, API vị trí địa lý và API thông báo.

WRS và Googlebot không hỗ trợ giao thức WebSocket

Googlebot và WRS chỉ hỗ trợ HTTP/1.x và FTP, dù có TLS hay không.

Theo dõi lỗi và gỡ lỗi

Ngoài việc sử dụng chức năng phát hiện tính năng và polyfill, hãy nhớ thu thập và phân tích các lỗi phía máy khách có thể ngăn ứng dụng của bạn hoạt động đúng cách khi người dùng và Googlebot truy cập.

Gửi phản hồi về...