Google Cloud Search có một số tính năng mở rộng, diễn giải và tối ưu hoá mặc định ảnh hưởng đến kết quả tìm kiếm. Nếu bạn thấy kết quả tìm kiếm không như mong đợi, hãy tham khảo hướng dẫn này trước khi liên hệ với bộ phận hỗ trợ của Cloud Search.
Trong tài liệu này, cụm từ tìm kiếm của người dùng được hiển thị trong dấu ngoặc vuông (như [query])
và cách diễn giải của hệ thống được hiển thị trong dấu ngoặc kép (như "interpretation").
Kết quả tìm kiếm trong tài liệu này là các ví dụ minh hoạ về hành vi và cung cấp thông tin chi tiết về cách hoạt động của các tính năng mở rộng, diễn giải và tối ưu hoá; kết quả thực tế có thể khác.
Tính năng mở rộng mặc định
Giả sử người dùng tìm kiếm [Joe’s PDFs], nhưng một số kết quả chứa
các từ được làm nổi bật như "documents" thay vì "PDFs". Điều này xảy ra vì Cloud Search mở rộng cụm từ tìm kiếm để bao gồm các từ đồng nghĩa và gốc từ, tương tự như Google Tìm kiếm. Tính năng mở rộng này giúp truy xuất các tài liệu phù hợp với ý tưởng và mục đích của cụm từ tìm kiếm. Sau đó, các thuật toán xếp hạng sẽ đảm bảo những kết quả phù hợp nhất xuất hiện ở đầu.
Khi người dùng tìm kiếm [Joe’s PDFs], Cloud Search có thể cung cấp thêm các từ sau:
- Đối với
[Joe’s], hệ thống có thể so khớp với"joe"(mở rộng gốc từ) và"joes"(từ đồng nghĩa dựa trên dấu câu). - Đối với
[PDFs], hệ thống có thể so khớp với"documents"(mở rộng từ đồng nghĩa) và"pdf"(mở rộng gốc từ).
Các từ đồng nghĩa mặc định không phải lúc nào cũng có tính hai chiều. Ví dụ: cụm từ tìm kiếm
[phishing] có thể so khớp với "phish", nhưng cụm từ tìm kiếm [phish] có thể không
so khớp với "phishing".
Tính năng mở rộng cho các từ có dấu gạch ngang và dấu gạch dưới
Cloud Search xử lý các từ có dấu gạch ngang và các từ tương đương không có dấu gạch ngang theo cách khác nhau, chẳng hạn như [walk-in closet] và [walk in closet].
Hệ thống cũng áp dụng các tính năng tối ưu hoá khác nhau cho các từ có dấu gạch ngang và dấu gạch dưới, chẳng hạn như [walk-in] và [walk_in].
Bù đắp cho các tính năng mở rộng mặc định
Cloud Search không đảm bảo bất kỳ tính năng mở rộng cụ thể nào. Để đảm bảo các từ đồng nghĩa có tính hai chiều hoặc các tính năng mở rộng dành riêng cho miền, hãy tạo từ đồng nghĩa của riêng bạn. Để biết thêm thông tin, hãy xem bài viết Xác định từ đồng nghĩa.
Cách diễn giải mặc định
Cloud Search cung cấp tính năng diễn giải ngôn ngữ tự nhiên dựa trên giản đồ nguồn dữ liệu của bạn. Để biết thêm thông tin, hãy xem bài viết Cấu trúc giản đồ để diễn giải cụm từ tìm kiếm tối ưu.
Tắt tính năng diễn giải ngôn ngữ tự nhiên
Để tắt tính năng diễn giải ngôn ngữ tự nhiên cho một cụm từ tìm kiếm cụ thể, hãy đặt
QueryInterpretationOptions.disableNlInterpretation
thành true trong yêu cầu tìm kiếm.
Tính năng tối ưu hoá mặc định
Cloud Search cung cấp các tính năng tối ưu hoá mặc định sau:
Kết hợp tính năng sửa lỗi chính tả: Đối với cụm từ tìm kiếm
[corpoate benefits], Cloud Search sẽ so khớp"corpoate"và cách viết đúng chính tả là,"corporate".Kết quả bổ sung: Đối với các cụm từ tìm kiếm có ít hoặc không có kết quả, Cloud Search sử dụng một tập hợp các cụm từ liên quan có tính cho phép. Để biết thêm thông tin, hãy xem bài viết Xử lý kết quả bổ sung.
Chuẩn hoá tài liệu và cụm từ tìm kiếm
Tính năng chuẩn hoá giúp chuẩn hoá các từ hoặc cụm từ trước hoặc sau một cụm từ tìm kiếm. Để đảm bảo phản hồi nhất quán, hãy cân nhắc các bước chuẩn hoá sau:
Cách chuẩn hoá tài liệu:
- Chọn một cách viết chính tắc cho các từ quan trọng trong kho lưu trữ của bạn.
- Sửa lỗi chính tả trong tài liệu nguồn hoặc trong quá trình lập chỉ mục để khớp với dạng chính tắc.
Cách chuẩn hoá cụm từ tìm kiếm:
- Chặn cụm từ tìm kiếm của người dùng trước khi gửi đến Cloud Search.
- Viết lại các từ trong cụm từ tìm kiếm để khớp với cách viết phổ biến nhất trong nguồn dữ liệu đã lập chỉ mục.
- Gửi cụm từ tìm kiếm đã viết lại đến Cloud Search.
Tắt tính năng mở rộng, diễn giải và tối ưu hoá
Để tắt các tính năng này cho một cụm từ tìm kiếm cụ thể, hãy đặt
QueryInterpretationOptions.enableVerbatimMode
thành true trong yêu cầu tìm kiếm.