Bù đắp cho các mở rộng, diễn giải và tối ưu hoá mặc định

Google Cloud Search có một số cách mở rộng, diễn giải và tối ưu hoá mặc định ảnh hưởng đến kết quả tìm kiếm. Nếu bạn thấy kết quả không mong muốn từ các cụm từ tìm kiếm, hãy tham khảo hướng dẫn này trước khi liên hệ với nhóm hỗ trợ của Cloud Search.

Mở rộng mặc định

Giả sử người dùng đang tìm kiếm bằng một chuỗi, chẳng hạn như [Joe’s PDF], nhưng một số kết quả trả về lại chứa các từ được đánh dấu, chẳng hạn như “tài liệu” thay vì "PDF". Tại sao kết quả chứa các từ được đánh dấu không có trong cụm từ tìm kiếm?

Theo mặc định, Google Cloud Search, giống như Google Web Search, không chỉ tìm kiếm chính xác các từ có trong truy vấn. Thay vào đó, Cloud Search sẽ mở rộng truy vấn để bao gồm các từ đồng nghĩa và gốc từ (ngay cả khi bạn chưa triển khai các từ đồng nghĩa của riêng mình). Việc mở rộng này được thực hiện để truy xuất các tài liệu phù hợp rộng với ý tưởng và ý định của truy vấn. Sau khi tập hợp các tài liệu rộng này được chọn, các thuật toán xếp hạng sẽ hoạt động để đảm bảo rằng các kết quả phù hợp nhất được đặt ở đầu tập hợp kết quả.

Khi người dùng tìm kiếm [ tệp PDF của Joe], Cloud Search đã cung cấp những từ sau đây dưới dạng các từ bổ sung được chấp nhận:

  • Đối với [Joe's], Cloud Search cũng có thể khớp với "joe" (mở rộng từ gốc) và "joes" (một từ đồng nghĩa dựa trên dấu câu).
  • Đối với [PDF], Cloud Search cũng có thể khớp với "tài liệu" (mở rộng từ đồng nghĩa) và "pdf" (mở rộng gốc).

Theo mặc định, các từ đồng nghĩa không nhất thiết phải là hai chiều. Ví dụ: nếu người dùng tìm kiếm cụm từ "lừa đảo", Cloud Search có thể khớp với "phish" dưới dạng một từ mở rộng từ đồng nghĩa. Tuy nhiên, nếu người dùng tìm kiếm cụm từ "lừa đảo", thì có thể Google sẽ không so khớp với cụm từ "lừa đảo" dưới dạng mở rộng.

Mở rộng cho từ có dấu gạch nối so với từ không có dấu gạch nối

Khi người dùng tìm kiếm các từ có dấu gạch nối so với các từ tương đương không có dấu gạch nối, chẳng hạn như [phòng thay đồ] và [đi lại trong tủ quần áo], Cloud Search sẽ xử lý các truy vấn này theo cách khác nhau.

Ngoài ra, các tính năng tối ưu hoá khác nhau cũng được sử dụng cho các từ có dấu gạch nối và dấu gạch dưới, chẳng hạn như [walk-in] và [walk_in].

Bù cho các bản mở rộng mặc định

Theo mặc định, chúng tôi không đảm bảo về việc mở rộng. Nếu bạn muốn đảm bảo tính hai chiều của từ đồng nghĩa hoặc cách mở rộng từ đồng nghĩa theo miền cụ thể, hãy tạo nhóm từ đồng nghĩa theo miền cụ thể của riêng bạn. Để biết thêm thông tin về cách triển khai từ đồng nghĩa, hãy tham khảo phần Định nghĩa từ đồng nghĩa.

Cách diễn giải mặc định

Cloud Search cũng cung cấp thông tin diễn giải ngôn ngữ tự nhiên để diễn giải các đối tượng, thuộc tính và giá trị của trường dùng trong truy vấn theo giản đồ đã tải lên cho một nguồn dữ liệu cụ thể. Để biết thêm thông tin về cách diễn giải ngôn ngữ tự nhiên này, hãy tham khảo bài viết Cấu trúc giản đồ để tối ưu cách diễn giải cụm từ tìm kiếm.

Tắt tính năng diễn giải ngôn ngữ tự nhiên

Để tắt tính năng diễn giải ngôn ngữ tự nhiên cho một cụm từ tìm kiếm cụ thể, hãy đặt QueryInterpretationOptions.disableNlInterpretation thành true trong yêu cầu tìm kiếm.

Tối ưu hoá mặc định

Cloud Search cũng cung cấp các chế độ tối ưu hoá mặc định sau:

  • Kết hợp các kết quả do tính năng sửa lỗi chính tả cung cấp. Ví dụ: nếu chuỗi truy vấn là [lợi ích của công ty], thì Cloud Search sẽ khớp với "công ty" và cách viết đúng chính tả của công ty là " công ty".

  • Đối với các truy vấn không mang lại hoặc có ít kết quả, Cloud Search sử dụng một tập hợp các cụm từ liên quan có phạm vi rộng hơn, rộng hơn từ đồng nghĩa trực tiếp, khi so khớp kết quả. Để biết thêm thông tin, hãy tham khảo bài viết Xử lý kết quả bổ sung.

Chuẩn hoá tài liệu và truy vấn

Chuẩn hoá là việc chuẩn hoá một số từ hoặc cụm từ trước hoặc sau khi người dùng thực hiện một truy vấn. Để đảm bảo câu trả lời nhất quán hơn cho các cụm từ tìm kiếm của bạn, hãy cân nhắc việc chuẩn hoá tài liệu (trước hoặc trong quá trình lập chỉ mục) và truy vấn (sau khi người dùng đã thực hiện truy vấn) theo những cách sau:

  • Cách chuẩn hoá tài liệu:

    1. Chọn một cách viết chính tắc cho các từ quan trọng dùng trong tài liệu thuộc kho lưu trữ của bạn.
    2. Sửa lỗi chính tả trong tài liệu kho lưu trữ nguồn hoặc khi lập chỉ mục nội dung, cho khớp với chính tả chuẩn.
  • Để chuẩn hoá truy vấn:

    1. Chặn các truy vấn của người dùng trước khi gửi chúng đến Cloud Search.
    2. Viết lại các từ trong cụm từ tìm kiếm của người dùng để khớp với cách viết phổ biến nhất trong nguồn dữ liệu được lập chỉ mục.
    3. Gửi truy vấn đến Cloud Search.

Tắt các tính năng mở rộng, diễn giải và tối ưu hoá cho mọi truy vấn

Để tắt tính năng mở rộng, diễn giải và tối ưu hoá cho một truy vấn cụ thể, hãy đặt QueryInterpretationOptions.enableVerbatim Mode thành true trong yêu cầu tìm kiếm.