खोज की क्वालिटी को बेहतर बनाएं

खोज की क्वालिटी का मतलब है कि खोज के नतीजे, रैंकिंग और रिकॉल के मामले में कितने अच्छे हैं. इसका आकलन उपयोगकर्ता करता है.

रैंकिंग का मतलब है कि आइटम किस क्रम में दिखते हैं. वहीं, रिकॉल का मतलब है कि खोज के हिसाब से कितने आइटम मिले. आइटम (या दस्तावेज़) ऐसा डिजिटल कॉन्टेंट होता है जिसे Google Cloud Search इंडेक्स कर सकता है. जैसे, Microsoft Office के दस्तावेज़, PDF फ़ाइलें, डेटाबेस की पंक्तियां या खास यूआरएल. किसी आइटम में ये चीज़ें शामिल होती हैं:

  • स्ट्रक्चर्ड मेटाडेटा
  • इंडेक्स किया जा सकने वाला कॉन्टेंट
  • ACL

Cloud Search, नतीजे पाने और उन्हें रैंक करने के लिए अलग-अलग सिग्नल का इस्तेमाल करता है. स्कीमा, आइटम के कॉन्टेंट और मेटाडेटा में मौजूद सेटिंग के साथ-साथ, सर्च ऐप्लिकेशन की सेटिंग में बदलाव करके, इन सिग्नल पर असर डाला जा सकता है. इस दस्तावेज़ में, सिग्नल पर असर डालने वाली इन सेटिंग में बदलाव करके, खोज की क्वालिटी को बेहतर बनाने का तरीका बताया गया है.

सेटिंग की खास जानकारी के लिए, खोज की क्वालिटी से जुड़ी सेटिंग की खास जानकारी देखें.

विषय के हिसाब से स्कोर पर असर डालना

विषय के हिसाब से स्कोर का मतलब है कि खोज का नतीजा, क्वेरी के शब्दों से कितना मिलता-जुलता है. Cloud Search, विषय के हिसाब से स्कोर की गणना इन आधार पर करता है:

  • क्वेरी के हर शब्द की अहमियत.
  • हिट की संख्या (क्वेरी का कोई शब्द, कॉन्टेंट या मेटाडेटा में कितनी बार दिखता है).
  • क्वेरी के शब्दों और इंडेक्स किए गए आइटम के बीच मैच के टाइप.

टेक्स्ट प्रॉपर्टी के विषय के हिसाब से स्कोर पर असर डालने के लिए, अपने स्कीमा में RetrievalImportance तय करें. RetrievalImportance की वैल्यू ज़्यादा होने पर, प्रॉपर्टी से मैच होने पर ज़्यादा स्कोर मिलता है.

उदाहरण के लिए, अगर आपने सॉफ़्टवेयर में मौजूद गड़बड़ियों का इतिहास सेव किया है, तो उपयोगकर्ता गड़बड़ी के नाम से क्वेरी कर सकते हैं. नाम के लिए, RetrievalImportance को HIGHEST पर सेट करें. मुख्य जानकारी के लिए, DEFAULT का इस्तेमाल करें.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

एचटीएमएल दस्तावेज़ों के लिए, <title> और <h1> जैसे टैग, शब्द की अहमियत तय करने में मदद करते हैं. अगर ContentFormat की वैल्यू TEXT है, तो ItemContent के लिए DEFAULT अहमियत का इस्तेमाल किया जाता है. अगर इसकी वैल्यू HTML है, तो अहमियत एचटीएमएल प्रॉपर्टी पर निर्भर करती है.

अपडेट होने की फ़्रीक्वेंसी पर असर डालना

अपडेट होने की फ़्रीक्वेंसी से यह पता चलता है कि किसी आइटम में हाल ही में कब बदलाव किया गया था. इसके लिए, createTime और updateTime में ItemMetadata का इस्तेमाल किया जाता है. पुराने आइटम की रैंक कम होती है.

में freshnessProperty और freshnessDuration को अडजस्ट करके, अपडेट होने की फ़्रीक्वेंसी पर असर डाला जा सकता है.FreshnessOptions freshnessProperty की मदद से, updateTime के बजाय, कस्टम तारीख या टाइमस्टैंप का इस्तेमाल किया जा सकता है. गड़बड़ियों के लिए, ड्यू डेट का इस्तेमाल किया जा सकता है. इससे, मौजूदा तारीख के सबसे करीब वाली तारीख वाले आइटम की रैंक ज़्यादा होगी.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

freshnessDuration का इस्तेमाल करके, यह तय किया जा सकता है कि कोई आइटम कब पुराना माना जाएगा. 100 साल जैसी ज़्यादा वैल्यू सेट करने पर, अपडेट होने की फ़्रीक्वेंसी का असर खत्म हो जाता है. यह सेटिंग, स्टैटिक डेटा के लिए काम की है. जैसे, कर्मचारियों की प्रोफ़ाइल. खबरों के लिए, तीन दिन जैसी कम वैल्यू का इस्तेमाल करें.

क्वालिटी पर असर डालना

क्वालिटी से यह पता चलता है कि कोई आइटम कितना सटीक और काम का है. SearchQualityMetadata का इस्तेमाल करके, 0 से 1 के बीच कोई वैल्यू तय करें. ज़्यादा वैल्यू सेट करने पर, रैंकिंग बेहतर होती है. उदाहरण के लिए, एचआर की ओर से लिखे गए फ़ायदों से जुड़े दस्तावेज़ों की रैंक बढ़ाई जा सकती है.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

फ़ील्ड टाइप का इस्तेमाल करके, रैंकिंग पर असर डालना

`OrderedRanking` का इस्तेमाल करके, enum या इंटिजर प्रॉपर्टी के आधार पर रैंकिंग पर असर डाला जा सकता है: OrderedRanking

  • NO_ORDER (डिफ़ॉल्ट): रैंकिंग पर कोई असर नहीं पड़ता.
  • ASCENDING: ज़्यादा वैल्यू सेट करने पर, रैंकिंग बेहतर होती है.
  • DESCENDING: कम वैल्यू सेट करने पर, रैंकिंग बेहतर होती है.

गड़बड़ी की प्राथमिकता के लिए, DESCENDING का इस्तेमाल करें. इसके लिए, HIGH की वैल्यू 1 और LOW की वैल्यू 3 होनी चाहिए. votes प्रॉपर्टी के लिए, ASCENDING का इस्तेमाल करें.

क्वेरी के विस्तार की सुविधा का इस्तेमाल करके, रैंकिंग पर असर डालना

क्वेरी के विस्तार की सुविधा, नतीजों को बेहतर बनाने के लिए समानार्थी शब्दों और स्पेलिंग का इस्तेमाल करती है.

समानार्थी शब्दों का इस्तेमाल करना

Cloud Search, समानार्थी शब्दों के लिए सार्वजनिक वेब कॉन्टेंट का इस्तेमाल करता है. संगठन के हिसाब से खास शब्दावली के लिए, कस्टम समानार्थी शब्द भी तय किए जा सकते हैं. समानार्थी शब्द तय करना लेख देखें.

स्पेलिंग की सुविधा का इस्तेमाल करना

Cloud Search, SpellResultमें स्पेलिंग के सुझाव देता है. यह दस्तावेज़ ढूंढने के लिए, स्पेलिंग में की गई गड़बड़ियों को ठीक करने की सुविधा का इस्तेमाल, समानार्थी शब्दों के तौर पर भी करता है.

सर्च ऐप्लिकेशन की सेटिंग का इस्तेमाल करके, रैंकिंग पर असर डालना

सर्च ऐप्लिकेशन, कॉन्टेक्स्ट के हिसाब से जानकारी देता है. रैंकिंग पर असर डालने के लिए, इन सेटिंग का इस्तेमाल किया जा सकता है.

स्कोरिंग कॉन्फ़िगरेशन में बदलाव करना

अपडेट होने की फ़्रीक्वेंसी या दिलचस्पी के हिसाब से कॉन्टेंट दिखाने की सुविधा बंद करने के लिए, ScoringConfig तय करें. दिलचस्पी के हिसाब से कॉन्टेंट दिखाने की सुविधा बंद करने पर, मालिक और इंटरैक्शन के आधार पर मिलने वाले बूस्ट हट जाते हैं. खोज के अनुभव को पसंद के मुताबिक बनाना लेख देखें .

सोर्स कॉन्फ़िगरेशन में बदलाव करना

डेटा सोर्स के लेवल पर सेटिंग तय करें:

  • सोर्स की अहमियत: HIGH अहमियत वाले सोर्स के आइटम की रैंक ज़्यादा होती है.
  • क्राउडिंग: एक ही सोर्स से मिलने वाले नतीजों की संख्या सीमित करता है. डिफ़ॉल्ट रूप से, यह संख्या तीन होती है, ताकि अलग-अलग सोर्स से नतीजे मिल सकें.

दिलचस्पी के हिसाब से कॉन्टेंट दिखाना

दिलचस्पी के हिसाब से कॉन्टेंट दिखाने की सुविधा, उपयोगकर्ता के आधार पर नतीजों को प्राथमिकता देती है:

  • आइटम का मालिकाना हक: उपयोगकर्ता के मालिकाना हक वाले आइटम की रैंक बढ़ जाती है.
  • आइटम से इंटरैक्शन: उपयोगकर्ता ने हाल ही में जिन आइटम को देखा, उनमें बदलाव किया या जिन पर टिप्पणी की उनकी रैंक बढ़ जाती है.
  • उपयोगकर्ता के क्लिक: उपयोगकर्ता ने पहले जिन आइटम पर क्लिक किया उनकी रैंक बढ़ जाती है. नतीजे के यूआरएल में बदलाव न करें, क्योंकि इसका इस्तेमाल यह डेटा इकट्ठा करने के लिए किया जाता है.

क्वेरी की व्याख्या करना

क्वेरी की व्याख्या करना सुविधा, स्कीमा की डेफ़िनिशन का इस्तेमाल करके, उपयोगकर्ता की क्वेरी को स्ट्रक्चर्ड और ऑपरेटर पर आधारित क्वेरी में बदलती है. इससे कम कीवर्ड इस्तेमाल करने पर भी सटीक नतीजे मिलते हैं. क्वेरी की व्याख्या करने की सुविधा को बेहतर बनाने के लिए, स्कीमा का स्ट्रक्चर तैयार करना लेख देखें.

आइटम की भाषा

Cloud Search, उन आइटम की रैंक कम कर देता है जिनकी भाषा, क्वेरी की भाषा से मेल नहीं खाती. उपयोगकर्ता की पसंद के हिसाब से languageCode को RequestOptions सेट करें.

आइटम का कॉन्टेक्स्ट

contextAttributes का इस्तेमाल करके, क्वेरी के कॉन्टेक्स्ट से जुड़े आइटम की रैंक बढ़ाई जा सकती है. जैसे, जगह या विभाग.

आइटम की लोकप्रियता

Cloud Search, उन आइटम की रैंक बढ़ा देता है जिन पर उपयोगकर्ता, हाल की क्वेरी में अक्सर क्लिक करते हैं. खोज के नतीजों के यूआरएल में बदलाव न करें, क्योंकि इनका इस्तेमाल इन क्लिक को ट्रैक करने के लिए किया जाता है.

खोज की क्वालिटी से जुड़ी सेटिंग की खास जानकारी

यहां दी गई टेबल में, खोज की क्वालिटी से जुड़ी सेटिंग की खास जानकारी दी गई है:

स्कीमा सेटिंग

सेटिंग जगह सुझाव विवरण
ItemContent ItemContent सुझाए गए विषय के हिसाब से स्कोर
RetrievalImportance RetrievalImportance सुझाए गए विषय के हिसाब से स्कोर
FreshnessOptions FreshnessOptions वैकल्पिक अपडेट होने की फ़्रीक्वेंसी

इंडेक्स करने की सेटिंग

सेटिंग जगह सुझाव विवरण
createTime/updateTime ItemMetadata सुझाए गए अपडेट होने की फ़्रीक्वेंसी
contentLanguage ItemMetadata सुझाए गए आइटम की भाषा
owners ItemAcl सुझाए गए आइटम का मालिकाना हक
कस्टम समानार्थी शब्द _dictionaryEntry सुझाए गए समानार्थी शब्दों का इस्तेमाल करना
quality SearchQualityMetadata वैकल्पिक क्वालिटी पर असर डालना
इटरेक्शन डेटा interaction वैकल्पिक आइटम से इंटरैक्शन
OrderedRanking OrderedRanking वैकल्पिक फ़ील्ड टाइप

सर्च ऐप्लिकेशन की सेटिंग

सेटिंग जगह सुझाव विवरण
दिलचस्पी के हिसाब से कॉन्टेंट दिखाने की सुविधा बंद करना ScoringConfig सुझाए गए दिलचस्पी के हिसाब से कॉन्टेंट दिखाना
सोर्स की अहमियत SourceCrowdingConfig वैकल्पिक सोर्स कॉन्फ़िगरेशन
क्राउडिंग SourceCrowdingConfig वैकल्पिक सोर्स कॉन्फ़िगरेशन

अगले चरण

  1. क्वेरी की व्याख्या करने की सुविधा को बेहतर बनाने के लिए, स्कीमा का स्ट्रक्चर तैयार करना.
  2. समानार्थी शब्द तय करना.