Chất lượng tìm kiếm đề cập đến chất lượng của kết quả tìm kiếm về thứ hạng và khả năng thu hồi theo cảm nhận của người dùng.
Thứ hạng là thứ tự của các mục và khả năng thu hồi là số lượng mục có liên quan được truy xuất. Mục (hoặc tài liệu) là bất kỳ nội dung kỹ thuật số nào mà Google Cloud Search có thể lập chỉ mục, chẳng hạn như tài liệu Microsoft Office, tệp PDF, hàng trong cơ sở dữ liệu hoặc URL duy nhất. Một mục bao gồm:
- Siêu dữ liệu có cấu trúc
- Nội dung có thể lập chỉ mục
- ACL
Cloud Search sử dụng nhiều tín hiệu để truy xuất và xếp hạng kết quả. Bạn có thể tác động đến các tín hiệu này thông qua các chế độ cài đặt trong giản đồ, nội dung và siêu dữ liệu của mục cũng như ứng dụng tìm kiếm. Tài liệu này giúp bạn cải thiện chất lượng tìm kiếm bằng cách sửa đổi các yếu tố ảnh hưởng đến tín hiệu này.
Để biết thông tin tóm tắt về các chế độ cài đặt, hãy xem phần Tóm tắt các chế độ cài đặt chất lượng tìm kiếm.
Tác động đến điểm số về tính thời sự
Tính thời sự là mức độ liên quan của kết quả tìm kiếm đến các cụm từ tìm kiếm. Cloud Search tính toán tính thời sự dựa trên:
- Tầm quan trọng của từng cụm từ tìm kiếm.
- Số lượt truy cập (tần suất một cụm từ tìm kiếm xuất hiện trong nội dung hoặc siêu dữ liệu).
- Các kiểu khớp giữa cụm từ tìm kiếm và mục đã lập chỉ mục.
Để tác động đến điểm số về tính thời sự của một thuộc tính văn bản, hãy xác định
RetrievalImportance
trong giản đồ. Kết quả khớp trên một thuộc tính có RetrievalImportance cao sẽ có điểm số cao hơn.
Ví dụ: nếu bạn lưu trữ nhật ký lỗi phần mềm, thì người dùng có thể sẽ tìm kiếm theo tên lỗi.
Đặt RetrievalImportance cho tên thành HIGHEST. Đối với nội dung mô tả, hãy sử dụng DEFAULT.
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" }
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": { "importance": "DEFAULT" }
}
}
]
}
]
}
Đối với tài liệu HTML, các thẻ như <title> và <h1> giúp xác định tầm quan trọng của cụm từ. Nếu ContentFormat
là TEXT, thì ItemContent
sẽ sử dụng tầm quan trọng DEFAULT. Nếu là HTML, thì tầm quan trọng sẽ phụ thuộc vào các thuộc tính HTML.
Tác động đến tính mới
Tính mới đo lường thời gian gần đây nhất một mục được sửa đổi, sử dụng createTime và
updateTime trong
ItemMetadata.
Các mục cũ hơn sẽ có thứ hạng thấp hơn.
Bạn có thể tác động đến tính mới bằng cách điều chỉnh freshnessProperty và
freshnessDuration trong
FreshnessOptions.
freshnessProperty cho phép bạn sử dụng ngày hoặc dấu thời gian tuỳ chỉnh thay vì updateTime. Đối với lỗi, bạn có thể sử dụng ngày đến hạn để các mục có ngày gần nhất với hiện tại sẽ có thứ hạng cao hơn.
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": { "freshnessProperty": "duedate" }
}
}
]
}
Sử dụng freshnessDuration để chỉ định thời điểm một mục được coi là lỗi thời. Giá trị cao, chẳng hạn như 100 năm, sẽ vô hiệu hoá hiệu ứng tính mới. Điều này hữu ích cho dữ liệu tĩnh như hồ sơ nhân viên. Đối với tin tức, hãy sử dụng giá trị nhỏ như 3 ngày.
Tác động đến chất lượng
Chất lượng đo lường độ chính xác và mức độ hữu ích của một mục. Chỉ định một giá trị từ 0
đến 1 bằng cách sử dụng
SearchQualityMetadata.
Giá trị càng cao thì thứ hạng càng cao. Ví dụ: bạn có thể tăng thứ hạng cho các tài liệu về lợi ích do bộ phận nhân sự soạn thảo.
{
"metadata": {
"searchQualityMetadata": { "quality": 1.0 }
}
}
Tác động bằng cách sử dụng loại trường
Bạn có thể tác động đến thứ hạng dựa trên các thuộc tính enum hoặc số nguyên bằng cách sử dụng
OrderedRanking:
NO_ORDER(mặc định): Không ảnh hưởng đến thứ hạng.ASCENDING: Giá trị càng cao thì thứ hạng càng cao.DESCENDING: Giá trị càng thấp thì thứ hạng càng cao.
Đối với mức độ ưu tiên của lỗi, hãy sử dụng DESCENDING nếu HIGH là 1 và LOW là 3. Đối với thuộc tính votes, hãy sử dụng ASCENDING.
Tác động đến thứ hạng thông qua tính năng mở rộng truy vấn
Mở rộng truy vấn sử dụng từ đồng nghĩa và chính tả để cải thiện kết quả.
Sử dụng các từ đồng nghĩa
Cloud Search sử dụng nội dung công khai trên web cho các từ đồng nghĩa. Bạn cũng có thể xác định các từ đồng nghĩa tuỳ chỉnh cho thuật ngữ dành riêng cho tổ chức. Xem bài viết Xác định từ đồng nghĩa.
Sử dụng chính tả
Cloud Search cung cấp các đề xuất chính tả trong
SpellResult.
Tính năng này cũng sử dụng các bản sửa lỗi chính tả làm từ đồng nghĩa để tìm tài liệu.
Tác động đến thứ hạng thông qua chế độ cài đặt Ứng dụng tìm kiếm
Ứng dụng tìm kiếm cung cấp thông tin theo bối cảnh. Bạn có thể tác động đến thứ hạng bằng cách sử dụng các chế độ cài đặt sau.
Điều chỉnh cấu hình tính điểm
Chỉ định a
ScoringConfig
để tắt tính mới hoặc tính năng cá nhân hoá.
Việc tắt tính năng cá nhân hoá sẽ xoá các yếu tố tăng cường chủ sở hữu và lượt tương tác. Xem bài viết
Tuỳ chỉnh trải nghiệm tìm kiếm.
Điều chỉnh cấu hình nguồn
Chỉ định các chế độ cài đặt ở cấp nguồn dữ liệu:
- Tầm quan trọng của nguồn: Các mục từ nguồn có tầm quan trọng
HIGHsẽ có thứ hạng cao hơn. - Chèn lấn: Giới hạn kết quả từ một nguồn (mặc định là 3) để đảm bảo tính đa dạng.
Cá nhân hoá
Tính năng cá nhân hoá ưu tiên kết quả dựa trên người dùng:
- Quyền sở hữu mục: Tăng cường các mục do người dùng sở hữu.
- Lượt tương tác với mục: Tăng cường các mục mà người dùng đã xem, chỉnh sửa hoặc bình luận gần đây.
- Lượt nhấp của người dùng: Tăng cường các mục mà người dùng đã nhấp trước đó. Đừng sửa đổi URL kết quả vì URL này được dùng để thu thập dữ liệu này.
Diễn giải cụm từ tìm kiếm
Tính năng diễn giải cụm từ tìm kiếm chuyển đổi cụm từ tìm kiếm của người dùng thành cụm từ tìm kiếm có cấu trúc, dựa trên toán tử bằng cách sử dụng định nghĩa giản đồ. Tính năng này cung cấp kết quả chính xác ngay cả khi chỉ có một vài từ khoá. Xem bài viết Cấu trúc giản đồ để diễn giải cụm từ tìm kiếm tối ưu.
Ngôn ngữ của mục
Cloud Search hạ cấp các mục có ngôn ngữ không khớp với ngôn ngữ của cụm từ tìm kiếm. Đặt languageCode trong
RequestOptions
theo lựa chọn ưu tiên của người dùng.
Bối cảnh của mục
Sử dụng
contextAttributes
để tăng thứ hạng cho các mục có liên quan đến bối cảnh của cụm từ tìm kiếm, chẳng hạn như vị trí hoặc
bộ phận.
Mức độ phổ biến của mục
Cloud Search tăng cường các mục mà người dùng thường xuyên nhấp vào trong các cụm từ tìm kiếm gần đây. Đừng sửa đổi URL kết quả tìm kiếm vì URL này được dùng để theo dõi các lượt nhấp này.
Tóm tắt các chế độ cài đặt chất lượng tìm kiếm
Các bảng sau đây cung cấp thông tin tóm tắt về các chế độ cài đặt chất lượng tìm kiếm:
Cài đặt giản đồ
| Cài đặt | Thông tin vị trí | Nội dung đề xuất | Thông tin chi tiết |
|---|---|---|---|
ItemContent |
ItemContent |
Đề xuất | Tính thời sự |
RetrievalImportance |
RetrievalImportance |
Đề xuất | Tính thời sự |
FreshnessOptions |
FreshnessOptions |
Không bắt buộc | Tính mới |
Cài đặt lập chỉ mục
| Cài đặt | Thông tin vị trí | Nội dung đề xuất | Thông tin chi tiết |
|---|---|---|---|
createTime/updateTime |
ItemMetadata |
Đề xuất | Tính mới |
contentLanguage |
ItemMetadata |
Đề xuất | Ngôn ngữ của mục |
owners |
ItemAcl |
Đề xuất | Quyền sở hữu mục |
| Từ đồng nghĩa tuỳ chỉnh | _dictionaryEntry |
Đề xuất | Sử dụng các từ đồng nghĩa |
quality |
SearchQualityMetadata |
Không bắt buộc | Tác động đến chất lượng |
| Dữ liệu tương tác | interaction |
Không bắt buộc | Lượt tương tác với mục |
OrderedRanking |
OrderedRanking |
Không bắt buộc | Loại trường |
Cài đặt ứng dụng tìm kiếm
| Cài đặt | Thông tin vị trí | Nội dung đề xuất | Thông tin chi tiết |
|---|---|---|---|
| Tắt tính năng cá nhân hoá | ScoringConfig |
Đề xuất | Cá nhân hoá |
| Tầm quan trọng của nguồn | SourceCrowdingConfig |
Không bắt buộc | Cấu hình nguồn |
| Chèn lấn | SourceCrowdingConfig |
Không bắt buộc | Cấu hình nguồn |