Meningkatkan kualitas penelusuran

Kualitas penelusuran merujuk pada kualitas hasil penelusuran dari segi peringkat dan recall seperti yang diterima oleh pengguna.

Peringkat adalah urutan item, dan recall adalah jumlah item relevan yang diambil. Item (atau dokumen) adalah segala bentuk konten digital yang dapat diindeks oleh Google Cloud Search, seperti dokumen Microsoft Office, file PDF, baris database, atau URL unik. Item terdiri dari:

  • Metadata terstruktur
  • Konten yang dapat diindeks
  • ACL

Cloud Search menggunakan berbagai sinyal untuk mengambil dan memberi peringkat hasil. Anda dapat memengaruhi sinyal ini melalui setelan dalam skema, konten dan metadata item, serta aplikasi penelusuran. Dokumen ini membantu Anda meningkatkan kualitas penelusuran dengan mengubah penentu sinyal tersebut.

Untuk mengetahui ringkasan setelan, lihat Ringkasan setelan kualitas penelusuran.

Memengaruhi skor topikalitas

Topikalitas adalah relevansi hasil penelusuran dengan istilah kueri. Cloud Search menghitung topikalitas berdasarkan:

  • Tingkat kepentingan dari setiap istilah kueri.
  • Jumlah hit (seberapa sering istilah kueri muncul dalam konten atau metadata).
  • Jenis kecocokan antara istilah kueri dan item yang diindeks.

Untuk memengaruhi skor topikalitas properti teks, tentukan RetrievalImportance dalam skema Anda. Kecocokan pada properti dengan RetrievalImportance tinggi akan menghasilkan skor yang lebih tinggi.

Misalnya, jika Anda menyimpan histori bug software, pengguna kemungkinan akan membuat kueri berdasarkan nama bug. Tetapkan RetrievalImportance untuk nama ke HIGHEST. Untuk deskripsi, gunakan DEFAULT.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

Untuk dokumen HTML, tag seperti <title> dan <h1> membantu menentukan tingkat kepentingan istilah. Jika ContentFormat adalah TEXT, ItemContent menggunakan kepentingan DEFAULT. Jika HTML, tingkat kepentingan bergantung pada properti HTML.

Memengaruhi keaktualan

Keaktualan mengukur seberapa baru item diubah, menggunakan createTime dan updateTime di ItemMetadata. Item yang lebih lama memiliki peringkat yang lebih rendah.

Anda dapat memengaruhi keaktualan dengan menyesuaikan freshnessProperty dan freshnessDuration di FreshnessOptions. Dengan freshnessProperty, Anda dapat menggunakan tanggal atau stempel waktu kustom, bukan updateTime. Untuk bug, Anda dapat menggunakan batas waktu sehingga item dengan tanggal yang paling dekat dengan sekarang diberi peringkat lebih tinggi.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

Gunakan freshnessDuration untuk menentukan kapan suatu item dianggap tidak berlaku lagi. Nilai yang tinggi, seperti 100 tahun, akan menghilangkan efek keaktualan. Hal ini berguna untuk data statis seperti profil karyawan. Untuk berita, gunakan nilai kecil seperti tiga hari.

Memengaruhi kualitas

Kualitas mengukur akurasi dan kegunaan suatu item. Tentukan nilai antara 0 dan 1 menggunakan SearchQualityMetadata. Nilai yang lebih tinggi akan meningkatkan peringkat. Misalnya, Anda dapat meningkatkan dokumen manfaat yang ditulis oleh HRD.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

Memengaruhi dengan jenis kolom

Anda dapat memengaruhi peringkat berdasarkan properti enumerasi atau bilangan bulat menggunakan OrderedRanking:

  • NO_ORDER (default): Tidak memengaruhi peringkat.
  • ASCENDING: Nilai yang lebih tinggi akan meningkatkan peringkat.
  • DESCENDING: Nilai yang lebih rendah meningkatkan peringkat.

Untuk prioritas bug, gunakan DESCENDING jika HIGH adalah 1 dan LOW adalah 3. Untuk properti votes, gunakan ASCENDING.

Memengaruhi peringkat melalui perluasan kueri

Perluasan kueri menggunakan sinonim dan ejaan untuk meningkatkan kualitas hasil.

Gunakan sinonim

Cloud Search menggunakan konten web publik untuk sinonim. Anda juga dapat menentukan sinonim kustom untuk terminologi khusus organisasi. Lihat Menentukan sinonim.

Menggunakan ejaan

Cloud Search memberikan saran ejaan di SpellResult. Fitur ini juga menggunakan koreksi ejaan sebagai sinonim untuk menemukan dokumen.

Memengaruhi peringkat melalui setelan Aplikasi Penelusuran

Aplikasi Penelusuran memberikan informasi kontekstual. Anda dapat memengaruhi peringkat menggunakan setelan berikut.

Menyesuaikan konfigurasi pemberian skor

Tentukan ScoringConfig untuk menonaktifkan keaktualan atau personalisasi. Menonaktifkan personalisasi akan menghapus peningkatan pemilik dan interaksi. Lihat Menyesuaikan pengalaman penelusuran.

Menyesuaikan konfigurasi sumber

Tentukan setelan tingkat sumber data:

  • Tingkat kepentingan sumber: Item dari sumber dengan tingkat kepentingan HIGH akan diberi peringkat lebih tinggi.
  • Pengelompokan: Membatasi hasil dari satu sumber (defaultnya adalah 3) untuk memastikan keragaman.

Personalisasi

Personalisasi memprioritaskan hasil berdasarkan pengguna:

  • Kepemilikan item: Meningkatkan item yang dimiliki oleh pengguna.
  • Interaksi item: Meningkatkan item yang baru-baru ini dilihat, diedit, atau dikomentari pengguna.
  • Klik pengguna: Meningkatkan item yang sebelumnya diklik pengguna. Jangan ubah URL hasil, karena digunakan untuk mengumpulkan data ini.

Interpretasi kueri

Fitur interpretasi kueri mengonversi kueri pengguna menjadi kueri terstruktur berbasis operator menggunakan definisi skema. Fitur ini memberikan hasil yang tepat meskipun dengan kata kunci yang minimal. Lihat Membuat struktur skema untuk mendapatkan interpretasi kueri yang optimal.

Bahasa item

Cloud Search menurunkan peringkat item yang bahasanya tidak cocok dengan bahasa kueri. Tetapkan languageCode di RequestOptions sesuai preferensi pengguna.

Konteks item

Gunakan contextAttributes untuk meningkatkan peringkat item yang relevan dengan konteks kueri, seperti lokasi atau departemen.

Popularitas item

Cloud Search meningkatkan kualitas item yang sering diklik pengguna dalam kueri terbaru. Jangan ubah URL hasil penelusuran, karena URL tersebut digunakan untuk melacak klik ini.

Ringkasan setelan kualitas penelusuran

Tabel berikut memberikan ringkasan setelan kualitas penelusuran:

Setelan skema:

Setelan Lokasi Rekomendasi Detail
ItemContent ItemContent Disarankan Topikalitas (Topicality)
RetrievalImportance RetrievalImportance Disarankan Topikalitas (Topicality)
FreshnessOptions FreshnessOptions Opsional Keaktualan

Setelan pengindeksan

Setelan Lokasi Rekomendasi Detail
createTime/updateTime ItemMetadata Disarankan Keaktualan
contentLanguage ItemMetadata Disarankan Bahasa item
owners ItemAcl Disarankan Kepemilikan item
Sinonim kustom _dictionaryEntry Disarankan Menggunakan sinonim
quality SearchQualityMetadata Opsional Memengaruhi kualitas
Data interaksi interaction Opsional Interaksi item
OrderedRanking OrderedRanking Opsional Jenis kolom

Setelan aplikasi penelusuran

Setelan Lokasi Rekomendasi Detail
Nonaktifkan personalisasi ScoringConfig Disarankan Personalisasi
Tingkat kepentingan sumber SourceCrowdingConfig Opsional Konfigurasi sumber
Crowding SourceCrowdingConfig Opsional Konfigurasi sumber

Langkah Berikutnya

  1. Buat struktur skema untuk mendapatkan interpretasi kueri yang optimal.
  2. Menentukan sinonim.