Arama kalitesini artırmak

Arama kalitesi, arama sonuçlarının kullanıcı tarafından algılanan sıralama ve hatırlama açısından kalitesini ifade eder.

Sıralama, öğelerin sırasını, hatırlama ise alınan alakalı öğelerin sayısını ifade eder. Öğe (veya doküman), Google Cloud Search'ün dizine ekleyebileceği herhangi bir dijital içerik parçasıdır (ör. Microsoft Office dokümanları, PDF dosyaları, veritabanı satırları veya benzersiz URL'ler). Bir öğe şunlardan oluşur:

  • Yapılandırılmış meta veriler
  • Dizine eklenebilir içerik
  • EKL'ler

Cloud Search, sonuçları almak ve sıralamak için çeşitli sinyaller kullanır. Bu sinyalleri şema, öğe içeriği ve meta verilerdeki ayarların yanı sıra arama uygulaması aracılığıyla etkileyebilirsiniz. Bu belge, bu sinyal etkileyicilerini değiştirerek arama kalitesini artırmanıza yardımcı olur.

Ayarların özeti için Arama kalitesi ayarlarının özeti başlıklı makaleyi inceleyin.

Konuyla alaka puanını etkileme

Konuyla alaka, bir arama sonucunun sorgu terimleriyle alaka düzeyidir. Cloud Search, güncelliği şu ölçütlere göre hesaplar:

  • Her bir sorgu teriminin önemi.
  • İsabet sayısı (sorgu teriminin içerikte veya meta verilerde görünme sıklığı).
  • Sorgu terimleri ile dizine eklenmiş öğeler arasındaki eşleme türleri.

Bir metin özelliğinin konuyla alaka puanını etkilemek için şemanızda RetrievalImportance özelliğini tanımlayın. Yüksek RetrievalImportance sonuçları olan bir mülkteki eşleşme daha yüksek puanla sonuçlanır.

Örneğin, yazılım hatası geçmişini saklıyorsanız kullanıcılar büyük olasılıkla hata adına göre sorgu gönderir. Ad için RetrievalImportance değerini HIGHEST olarak ayarlayın. Açıklamalar için DEFAULT kullanın.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

HTML belgelerinde, <title> ve <h1> gibi etiketler terim önemini belirlemeye yardımcı olur. ContentFormat TEXT ise ItemContent DEFAULT önemini kullanır. HTML ise önem, HTML özelliklerine bağlıdır.

Etki güncelliği

Güncellik, bir öğenin ne kadar süre önce değiştirildiğini ölçer. Bu ölçüm için ItemMetadata içinde createTime ve updateTime kullanılır. Eski öğeler daha düşük sıralanır.

freshnessProperty ve freshnessDuration değerlerini FreshnessOptions bölümünden ayarlayarak güncelliği etkileyebilirsiniz. freshnessProperty, updateTime yerine özel bir tarih veya zaman damgası kullanmanıza olanak tanır. Hatalar için, şu ana en yakın tarihlere sahip öğelerin daha üst sıralarda yer alması amacıyla son kullanma tarihi kullanabilirsiniz.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

Bir öğenin ne zaman güncelliğini yitirmiş olarak kabul edileceğini belirtmek için freshnessDuration özelliğini kullanın. 100 yıl gibi yüksek bir değer, güncellik etkisini ortadan kaldırır. Bu özellik, çalışan profilleri gibi statik veriler için kullanışlıdır. Haberler için üç gün gibi küçük bir değer kullanın.

Kaliteyi etkileme

Kalite, bir öğenin doğruluğunu ve kullanışlılığını ölçer. SearchQualityMetadata kullanarak 0 ile 1 arasında bir değer belirtin. Daha yüksek değerler sıralamayı yükseltir. Örneğin, İK tarafından oluşturulan avantaj belgelerini öne çıkarabilirsiniz.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

Alan türünü kullanarak etkileme

OrderedRanking kullanarak sıralamayı enum veya tam sayı özelliklerine göre etkileyebilirsiniz:

  • NO_ORDER (varsayılan): Sıralama üzerinde etkisi yoktur.
  • ASCENDING: Daha yüksek değerler sıralamayı yükseltir.
  • DESCENDING: Daha düşük değerler sıralamayı yükseltir.

Hata önceliği için HIGH 1 ve LOW 3 ise DESCENDING değerini kullanın. votes mülk için ASCENDING kullanın.

Sorgu genişletme yoluyla sıralamayı etkileme

Sorgu genişletme, sonuçları iyileştirmek için eş anlamlı kelimeler ve yazım denetimi kullanır.

Eş anlamlıları kullan

Cloud Search, eş anlamlı kelimeler için herkese açık web içeriğini kullanır. Ayrıca, kuruluşa özgü terminoloji için özel eş anlamlılar da tanımlayabilirsiniz. Eş anlamlıları tanımlama başlıklı makaleye bakın.

Yazım denetimini kullanma

Cloud Search, SpellResult dilinde yazım önerileri sunar. Ayrıca, dokümanları bulmak için yazım düzeltmelerini eş anlamlı olarak kullanır.

Arama uygulaması ayarlarıyla sıralamayı etkileme

Arama uygulaması, bağlam bilgileri sağlar. Aşağıdaki ayarları kullanarak sıralamayı etkileyebilirsiniz.

Puanlandırma yapılandırmasını ayarlama

Güncelliği veya kişiselleştirmeyi devre dışı bırakmak için bir ScoringConfig belirtin. Kişiselleştirme devre dışı bırakıldığında sahip ve etkileşim artışları kaldırılır. Arama deneyimini özelleştirme başlıklı makaleyi inceleyin.

Kaynak yapılandırmasını ayarlama

Veri kaynağı düzeyindeki ayarları belirtin:

  • Kaynak önemi: HIGH önemindeki kaynaklardan gelen öğeler daha üst sıralarda yer alır.
  • Ana Makine İzleyici: Çeşitliliği sağlamak için tek bir kaynaktan gelen sonuçları sınırlar (varsayılan değer 3'tür).

Kişiselleştirme

Kişiselleştirme, sonuçları kullanıcıya göre önceliklendirir:

  • Öğe sahipliği: Kullanıcının sahip olduğu öğeleri öne çıkarır.
  • Öğe etkileşimi: Kullanıcının yakın zamanda görüntülediği, düzenlediği veya yorum yaptığı öğeleri öne çıkarır.
  • Kullanıcı tıklamaları: Kullanıcının daha önce tıkladığı öğeleri öne çıkarır. Bu verileri toplamak için kullanılan sonuç URL'sini değiştirmeyin.

Sorgu yorumlama

Sorgu yorumlama özelliği, kullanıcı sorgularını şema tanımlarını kullanarak yapılandırılmış, operatör tabanlı sorgulara dönüştürür. Bu sayede, en az anahtar kelimeyle bile hassas sonuçlar elde edebilirsiniz. En iyi sorgu yorumu için şema oluşturma başlıklı makaleye bakın.

Öğe dili

Cloud Search, dili sorgu diliyle eşleşmeyen öğeleri alt sıralara indirir. RequestOptions'de languageCode ayarını kullanıcının tercihine göre belirleyin.

Öğe bağlamı

Konum veya departman gibi sorgu bağlamıyla alakalı öğelerin sıralamasını artırmak için contextAttributes kullanın.

Öğenin popülerliği

Cloud Search, son sorgularda kullanıcıların sıkça tıkladığı öğeleri öne çıkarır. Bu tıklamaları izlemek için kullanıldığından arama sonucu URL'lerini değiştirmeyin.

Arama kalitesi ayarlarının özeti

Aşağıdaki tablolarda, arama kalitesi ayarlarının özeti verilmiştir:

Şema ayarları

Ayar Konum Öneri Ayrıntılar
ItemContent ItemContent Önerilen Konuyla alaka (Topicality)
RetrievalImportance RetrievalImportance Önerilen Konuyla alaka (Topicality)
FreshnessOptions FreshnessOptions İsteğe bağlı Tazelik

Dizin oluşturma ayarları

Ayar Konum Öneri Ayrıntılar
createTime/updateTime ItemMetadata Önerilen Tazelik
contentLanguage ItemMetadata Önerilen Öğe dili
owners ItemAcl Önerilen Öğe sahipliği
Özel eş anlamlılar _dictionaryEntry Önerilen Eş anlamlı kelimeler kullanma
quality SearchQualityMetadata İsteğe bağlı Kaliteyi etkileme
Etkileşim verileri interaction İsteğe bağlı Öğe etkileşimi
OrderedRanking OrderedRanking İsteğe bağlı Alan türü

Arama uygulaması ayarları

Ayar Konum Öneri Ayrıntılar
Kişiselleştirmeyi devre dışı bırak ScoringConfig Önerilen Kişiselleştirme
Kaynağın önem düzeyi SourceCrowdingConfig İsteğe bağlı Kaynak yapılandırması
Dışlama SourceCrowdingConfig İsteğe bağlı Kaynak yapılandırması

Sonraki Adımlar

  1. En iyi sorgu yorumu için bir şema oluşturun.
  2. Eş anlamlı kelimeleri tanımlayın.