Chất lượng tìm kiếm đề cập đến chất lượng của kết quả tìm kiếm về thứ hạng và khả năng thu hồi theo cảm nhận của người dùng.
Xếp hạng là thứ tự của các mục và mức độ phù hợp là số lượng mục có liên quan được truy xuất. Mục (hoặc tài liệu) là bất kỳ nội dung kỹ thuật số nào mà Google Cloud Search có thể lập chỉ mục, chẳng hạn như tài liệu Microsoft Office, tệp PDF, hàng trong cơ sở dữ liệu hoặc URL duy nhất. Một mục bao gồm:
- Siêu dữ liệu có cấu trúc
- Nội dung có thể lập chỉ mục
- ACL
Cloud Search sử dụng nhiều tín hiệu để truy xuất và xếp hạng kết quả. Bạn có thể tác động đến những tín hiệu này thông qua các chế độ cài đặt trong giản đồ, nội dung và siêu dữ liệu của mục, cũng như ứng dụng tìm kiếm. Tài liệu này giúp bạn cải thiện chất lượng tìm kiếm bằng cách sửa đổi những yếu tố ảnh hưởng đến tín hiệu này.
Để xem phần tóm tắt về các chế độ cài đặt, hãy xem Tóm tắt các chế độ cài đặt chất lượng tìm kiếm.
Ảnh hưởng đến điểm mức độ liên quan
Tính thời sự là mức độ liên quan của một kết quả tìm kiếm đối với các cụm từ tìm kiếm. Cloud Search tính toán tính thời sự dựa trên:
- Tầm quan trọng của từng cụm từ tìm kiếm.
- Số lượt trùng khớp (tần suất một cụm từ tìm kiếm xuất hiện trong nội dung hoặc siêu dữ liệu).
- Các kiểu khớp giữa cụm từ tìm kiếm và mục được lập chỉ mục.
Để ảnh hưởng đến điểm số mức độ liên quan theo chủ đề của một thuộc tính văn bản, hãy xác định RetrievalImportance trong giản đồ của bạn. Kết quả trùng khớp trên một cơ sở lưu trú có nhiều RetrievalImportance sẽ giúp bạn ghi điểm cao hơn.
Ví dụ: nếu bạn lưu trữ nhật ký lỗi phần mềm, thì người dùng có thể truy vấn theo tên lỗi.
Đặt RetrievalImportance cho tên thành HIGHEST. Đối với nội dung mô tả, hãy sử dụng DEFAULT.
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" }
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": { "importance": "DEFAULT" }
}
}
]
}
]
}
Đối với tài liệu HTML, các thẻ như <title> và <h1> giúp xác định mức độ quan trọng của thuật ngữ. Nếu ContentFormat là TEXT, thì ItemContent sẽ sử dụng mức độ quan trọng DEFAULT. Nếu là HTML, tầm quan trọng sẽ phụ thuộc vào các thuộc tính HTML.
Độ mới của ảnh hưởng
Độ mới đo lường thời gian gần đây nhất mà một mục được sửa đổi, sử dụng createTime và updateTime trong ItemMetadata.
Các mục cũ hơn sẽ có thứ hạng thấp hơn.
Bạn có thể điều chỉnh độ mới bằng cách điều chỉnh freshnessProperty và freshnessDuration trong FreshnessOptions.
freshnessProperty cho phép bạn sử dụng ngày hoặc dấu thời gian tuỳ chỉnh thay vì updateTime. Đối với lỗi, bạn có thể sử dụng ngày đến hạn để những mục có ngày gần với hiện tại nhất sẽ xếp hạng cao hơn.
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": { "freshnessProperty": "duedate" }
}
}
]
}
Sử dụng freshnessDuration để chỉ định thời điểm một mục được coi là đã lỗi thời. Giá trị cao, chẳng hạn như 100 năm, sẽ vô hiệu hoá hiệu ứng về độ mới mẻ. Điều này hữu ích cho dữ liệu tĩnh như hồ sơ nhân viên. Đối với tin tức, hãy sử dụng một giá trị nhỏ như 3 ngày.
Chất lượng ảnh hưởng
Chất lượng đo lường độ chính xác và mức độ hữu ích của một mặt hàng. Chỉ định một giá trị từ 0 đến 1 bằng cách sử dụng SearchQualityMetadata.
Giá trị càng cao thì thứ hạng càng tăng. Ví dụ: bạn có thể tăng cường các tài liệu về lợi ích do bộ phận Nhân sự soạn thảo.
{
"metadata": {
"searchQualityMetadata": { "quality": 1.0 }
}
}
Loại trường ảnh hưởng
Bạn có thể tác động đến thứ hạng dựa trên các thuộc tính enum hoặc số nguyên bằng cách sử dụng OrderedRanking:
NO_ORDER(mặc định): Không ảnh hưởng đến thứ hạng.ASCENDING: Giá trị càng cao thì thứ hạng càng tăng.DESCENDING: Giá trị càng thấp thì thứ hạng càng cao.
Đối với mức độ ưu tiên của lỗi, hãy dùng DESCENDING nếu HIGH là 1 và LOW là 3. Đối với thuộc tính votes, hãy sử dụng ASCENDING.
Tác động đến thứ hạng thông qua tính năng mở rộng truy vấn
Mở rộng cụm từ tìm kiếm sử dụng từ đồng nghĩa và lỗi chính tả để cải thiện kết quả.
Sử dụng các từ đồng nghĩa
Cloud Search sử dụng nội dung công khai trên web cho từ đồng nghĩa. Bạn cũng có thể xác định từ đồng nghĩa tuỳ chỉnh cho thuật ngữ dành riêng cho tổ chức. Xem phần Định nghĩa từ đồng nghĩa.
Sử dụng chính tả
Cloud Search cung cấp các đề xuất chính tả trong SpellResult.
Công cụ này cũng sử dụng tính năng sửa lỗi chính tả làm từ đồng nghĩa để tìm tài liệu.
Ảnh hưởng đến thứ hạng thông qua chế độ cài đặt Ứng dụng Tìm kiếm
Ứng dụng Tìm kiếm cung cấp thông tin theo bối cảnh. Bạn có thể tác động đến thứ hạng bằng cách sử dụng các chế độ cài đặt sau.
Điều chỉnh cấu hình tính điểm
Chỉ định một ScoringConfig để tắt độ mới hoặc hoạt động cá nhân hoá.
Khi tắt chế độ cá nhân hoá, bạn sẽ xoá chủ sở hữu và mức độ tương tác. Xem phần Tuỳ chỉnh trải nghiệm tìm kiếm.
Điều chỉnh cấu hình nguồn
Chỉ định các chế độ cài đặt ở cấp nguồn dữ liệu:
- Tầm quan trọng của nguồn: Các mục từ nguồn có tầm quan trọng
HIGHsẽ xếp hạng cao hơn. - Lọc kết quả tìm kiếm không mong muốn: Giới hạn số lượng kết quả từ một nguồn duy nhất (mặc định là 3) để đảm bảo tính đa dạng.
Cá nhân hoá
Tính năng cá nhân hoá ưu tiên kết quả dựa trên người dùng:
- Quyền sở hữu mặt hàng: Tăng cường mặt hàng thuộc sở hữu của người dùng.
- Tương tác với mục: Tăng cường những mục mà người dùng đã xem, chỉnh sửa hoặc bình luận gần đây.
- Lượt nhấp của người dùng: Tăng cường những mặt hàng mà người dùng đã nhấp vào trước đó. Đừng sửa đổi URL kết quả vì URL này được dùng để thu thập dữ liệu.
Diễn giải cụm từ tìm kiếm
Tính năng diễn giải cụm từ tìm kiếm chuyển đổi cụm từ tìm kiếm của người dùng thành cụm từ tìm kiếm có cấu trúc, dựa trên toán tử bằng cách sử dụng định nghĩa lược đồ. Điều này mang lại kết quả chính xác ngay cả khi có ít từ khoá. Xem phần Cấu trúc giản đồ để diễn giải truy vấn một cách tối ưu.
Ngôn ngữ của mặt hàng
Cloud Search hạ cấp những mục có ngôn ngữ không khớp với ngôn ngữ của cụm từ tìm kiếm. Đặt languageCode trong RequestOptions thành lựa chọn ưu tiên của người dùng.
Bối cảnh của mặt hàng
Sử dụng contextAttributes để tăng thứ hạng cho các mục có liên quan đến bối cảnh truy vấn, chẳng hạn như vị trí hoặc bộ phận.
Mức độ phổ biến của mặt hàng
Cloud Search tăng cường những mục mà người dùng thường xuyên nhấp vào trong các cụm từ tìm kiếm gần đây. Đừng sửa đổi URL kết quả tìm kiếm vì các URL này được dùng để theo dõi những lượt nhấp này.
Tóm tắt các chế độ cài đặt chất lượng tìm kiếm
Các bảng sau đây cung cấp thông tin tóm tắt về chế độ cài đặt chất lượng tìm kiếm:
Cài đặt giản đồ
| Cài đặt | Thông tin vị trí | Nội dung đề xuất | Thông tin chi tiết |
|---|---|---|---|
ItemContent |
ItemContent |
Đề xuất | Tính thời sự |
RetrievalImportance |
RetrievalImportance |
Đề xuất | Tính thời sự |
FreshnessOptions |
FreshnessOptions |
Không bắt buộc | Độ mới |
Cài đặt lập chỉ mục
| Cài đặt | Thông tin vị trí | Nội dung đề xuất | Thông tin chi tiết |
|---|---|---|---|
createTime/updateTime |
ItemMetadata |
Đề xuất | Độ mới |
contentLanguage |
ItemMetadata |
Đề xuất | Ngôn ngữ của mặt hàng |
owners |
ItemAcl |
Đề xuất | Quyền sở hữu mặt hàng |
| Từ đồng nghĩa tuỳ chỉnh | _dictionaryEntry |
Đề xuất | Sử dụng từ đồng nghĩa |
quality |
SearchQualityMetadata |
Không bắt buộc | Chất lượng của người có ảnh hưởng |
| Dữ liệu tương tác | interaction |
Không bắt buộc | Số lượt tương tác với mặt hàng |
OrderedRanking |
OrderedRanking |
Không bắt buộc | Loại trường |
Cài đặt ứng dụng tìm kiếm
| Cài đặt | Thông tin vị trí | Nội dung đề xuất | Thông tin chi tiết |
|---|---|---|---|
| Tắt cá nhân hóa | ScoringConfig |
Đề xuất | Cá nhân hoá |
| Tầm quan trọng của nguồn | SourceCrowdingConfig |
Không bắt buộc | Cấu hình nguồn |
| Chèn lấn | SourceCrowdingConfig |
Không bắt buộc | Cấu hình nguồn |