Kualitas penelusuran merujuk pada kualitas hasil penelusuran dari segi peringkat dan recall seperti yang diterima oleh pengguna.
Peringkat adalah urutan item, dan recall adalah jumlah item relevan yang diambil. Item (atau dokumen) adalah segala bentuk konten digital yang dapat diindeks oleh Google Cloud Search, seperti dokumen Microsoft Office, file PDF, baris database, atau URL unik. Item terdiri dari:
- Metadata terstruktur
- Konten yang dapat diindeks
- ACL
Cloud Search menggunakan berbagai sinyal untuk mengambil dan memberi peringkat hasil. Anda dapat memengaruhi sinyal ini melalui setelan dalam skema, konten dan metadata item, serta aplikasi penelusuran. Dokumen ini membantu Anda meningkatkan kualitas penelusuran dengan mengubah penentu sinyal tersebut.
Untuk mengetahui ringkasan setelan, lihat Ringkasan setelan kualitas penelusuran.
Memengaruhi skor topikalitas
Topikalitas adalah relevansi hasil penelusuran dengan istilah kueri. Cloud Search menghitung topikalitas berdasarkan:
- Tingkat kepentingan dari setiap istilah kueri.
- Jumlah hit (seberapa sering istilah kueri muncul dalam konten atau metadata).
- Jenis kecocokan antara istilah kueri dan item yang diindeks.
Untuk memengaruhi skor topikalitas properti teks, tentukan
RetrievalImportance
dalam skema Anda. Kecocokan pada properti dengan RetrievalImportance tinggi akan menghasilkan skor yang lebih tinggi.
Misalnya, jika Anda menyimpan histori bug software, pengguna kemungkinan akan membuat kueri berdasarkan nama bug.
Tetapkan RetrievalImportance untuk nama ke HIGHEST. Untuk deskripsi, gunakan
DEFAULT.
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" }
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": { "importance": "DEFAULT" }
}
}
]
}
]
}
Untuk dokumen HTML, tag seperti <title> dan <h1> membantu menentukan tingkat kepentingan istilah. Jika ContentFormat
adalah TEXT, ItemContent
menggunakan kepentingan DEFAULT. Jika HTML, tingkat kepentingan bergantung pada properti HTML.
Memengaruhi keaktualan
Keaktualan mengukur seberapa baru item diubah, menggunakan createTime dan updateTime di ItemMetadata.
Item yang lebih lama memiliki peringkat yang lebih rendah.
Anda dapat memengaruhi keaktualan dengan menyesuaikan freshnessProperty dan
freshnessDuration di
FreshnessOptions.
Dengan freshnessProperty, Anda dapat menggunakan tanggal atau stempel waktu kustom, bukan updateTime. Untuk bug, Anda dapat menggunakan batas waktu sehingga item dengan tanggal yang paling dekat dengan sekarang diberi peringkat lebih tinggi.
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": { "freshnessProperty": "duedate" }
}
}
]
}
Gunakan freshnessDuration untuk menentukan kapan suatu item dianggap tidak berlaku lagi. Nilai yang tinggi, seperti 100 tahun, akan menghilangkan efek keaktualan. Hal ini berguna untuk data statis seperti profil karyawan. Untuk berita, gunakan nilai kecil seperti tiga hari.
Memengaruhi kualitas
Kualitas mengukur akurasi dan kegunaan suatu item. Tentukan nilai antara 0 dan 1 menggunakan
SearchQualityMetadata.
Nilai yang lebih tinggi akan meningkatkan peringkat. Misalnya, Anda dapat meningkatkan dokumen manfaat yang ditulis oleh HRD.
{
"metadata": {
"searchQualityMetadata": { "quality": 1.0 }
}
}
Memengaruhi dengan jenis kolom
Anda dapat memengaruhi peringkat berdasarkan properti enumerasi atau bilangan bulat menggunakan
OrderedRanking:
NO_ORDER(default): Tidak memengaruhi peringkat.ASCENDING: Nilai yang lebih tinggi akan meningkatkan peringkat.DESCENDING: Nilai yang lebih rendah meningkatkan peringkat.
Untuk prioritas bug, gunakan DESCENDING jika HIGH adalah 1 dan LOW adalah 3. Untuk properti votes, gunakan ASCENDING.
Memengaruhi peringkat melalui perluasan kueri
Perluasan kueri menggunakan sinonim dan ejaan untuk meningkatkan kualitas hasil.
Gunakan sinonim
Cloud Search menggunakan konten web publik untuk sinonim. Anda juga dapat menentukan sinonim kustom untuk terminologi khusus organisasi. Lihat Menentukan sinonim.
Menggunakan ejaan
Cloud Search memberikan saran ejaan di
SpellResult.
Fitur ini juga menggunakan koreksi ejaan sebagai sinonim untuk menemukan dokumen.
Memengaruhi peringkat melalui setelan Aplikasi Penelusuran
Aplikasi Penelusuran memberikan informasi kontekstual. Anda dapat memengaruhi peringkat menggunakan setelan berikut.
Menyesuaikan konfigurasi pemberian skor
Tentukan
ScoringConfig
untuk menonaktifkan keaktualan atau personalisasi.
Menonaktifkan personalisasi akan menghapus peningkatan pemilik dan interaksi. Lihat
Menyesuaikan pengalaman penelusuran.
Menyesuaikan konfigurasi sumber
Tentukan setelan tingkat sumber data:
- Tingkat kepentingan sumber: Item dari sumber dengan tingkat kepentingan
HIGHakan diberi peringkat lebih tinggi. - Pengelompokan: Membatasi hasil dari satu sumber (defaultnya adalah 3) untuk memastikan keragaman.
Personalisasi
Personalisasi memprioritaskan hasil berdasarkan pengguna:
- Kepemilikan item: Meningkatkan item yang dimiliki oleh pengguna.
- Interaksi item: Meningkatkan item yang baru-baru ini dilihat, diedit, atau dikomentari pengguna.
- Klik pengguna: Meningkatkan item yang sebelumnya diklik pengguna. Jangan ubah URL hasil, karena digunakan untuk mengumpulkan data ini.
Interpretasi kueri
Fitur interpretasi kueri mengonversi kueri pengguna menjadi kueri terstruktur berbasis operator menggunakan definisi skema. Fitur ini memberikan hasil yang tepat meskipun dengan kata kunci yang minimal. Lihat Membuat struktur skema untuk mendapatkan interpretasi kueri yang optimal.
Bahasa item
Cloud Search menurunkan peringkat item yang bahasanya tidak cocok dengan bahasa kueri. Tetapkan languageCode di
RequestOptions
sesuai preferensi pengguna.
Konteks item
Gunakan
contextAttributes
untuk meningkatkan peringkat item yang relevan dengan konteks kueri, seperti lokasi atau
departemen.
Popularitas item
Cloud Search meningkatkan kualitas item yang sering diklik pengguna dalam kueri terbaru. Jangan ubah URL hasil penelusuran, karena URL tersebut digunakan untuk melacak klik ini.
Ringkasan setelan kualitas penelusuran
Tabel berikut memberikan ringkasan setelan kualitas penelusuran:
Setelan skema:
| Setelan | Lokasi | Rekomendasi | Detail |
|---|---|---|---|
ItemContent |
ItemContent |
Disarankan | Topikalitas (Topicality) |
RetrievalImportance |
RetrievalImportance |
Disarankan | Topikalitas (Topicality) |
FreshnessOptions |
FreshnessOptions |
Opsional | Keaktualan |
Setelan pengindeksan
| Setelan | Lokasi | Rekomendasi | Detail |
|---|---|---|---|
createTime/updateTime |
ItemMetadata |
Disarankan | Keaktualan |
contentLanguage |
ItemMetadata |
Disarankan | Bahasa item |
owners |
ItemAcl |
Disarankan | Kepemilikan item |
| Sinonim kustom | _dictionaryEntry |
Disarankan | Menggunakan sinonim |
quality |
SearchQualityMetadata |
Opsional | Memengaruhi kualitas |
| Data interaksi | interaction |
Opsional | Interaksi item |
OrderedRanking |
OrderedRanking |
Opsional | Jenis kolom |
Setelan aplikasi penelusuran
| Setelan | Lokasi | Rekomendasi | Detail |
|---|---|---|---|
| Nonaktifkan personalisasi | ScoringConfig |
Disarankan | Personalisasi |
| Tingkat kepentingan sumber | SourceCrowdingConfig |
Opsional | Konfigurasi sumber |
| Crowding | SourceCrowdingConfig |
Opsional | Konfigurasi sumber |