खोज के नतीजों की क्वालिटी से मतलब है कि उपयोगकर्ता को खोज के नतीजे किस तरह से दिखते हैं. जैसे, रैंकिंग और रिकॉल के हिसाब से.
रैंकिंग, आइटम का क्रम है. वहीं, रीकॉल, खोजे गए काम के आइटम की संख्या है. आइटम (या दस्तावेज़) ऐसा डिजिटल कॉन्टेंट होता है जिसे Google Cloud Search इंडेक्स कर सकता है. जैसे, Microsoft Office के दस्तावेज़, PDF फ़ाइलें, डेटाबेस की लाइनें या खास यूआरएल. किसी आइटम में ये चीज़ें शामिल होती हैं:
- स्ट्रक्चर्ड मेटाडेटा
- इंडेक्स किया जा सकने वाला कॉन्टेंट
- ACL
Cloud Search, नतीजे पाने और उन्हें रैंक करने के लिए अलग-अलग सिग्नल का इस्तेमाल करता है. स्कीमा, आइटम के कॉन्टेंट और मेटाडेटा, और खोज के लिए इस्तेमाल किए जाने वाले ऐप्लिकेशन की सेटिंग में जाकर, इन सिग्नल पर असर डाला जा सकता है. इस दस्तावेज़ में, सिग्नल इन्फ़्लुएंसर में बदलाव करके, खोज के नतीजों की क्वालिटी को बेहतर बनाने का तरीका बताया गया है.
बिना किसी नियम के की गई ट्यूनिंग की वजह से, खोज का अनुभव खराब हो सकता है.सेटिंग की खास जानकारी के लिए, खोज के नतीजों की क्वालिटी से जुड़ी सेटिंग की खास जानकारी देखें.
विषय के हिसाब से स्कोर पर असर डालता है
विषय के हिसाब से यह तय किया जाता है कि खोज के नतीजे, क्वेरी में इस्तेमाल किए गए शब्दों से कितने मिलते-जुलते हैं. Cloud Search, विषय के हिसाब से कॉन्टेंट की अहमियत का आकलन इन आधार पर करता है:
- क्वेरी के हर शब्द की अहमियत.
- हिट की संख्या (कॉन्टेंट या मेटाडेटा में क्वेरी टर्म कितनी बार दिखता है).
- क्वेरी टर्म और इंडेक्स किए गए आइटम के बीच मैच टाइप.
किसी टेक्स्ट प्रॉपर्टी के विषय के हिसाब से स्कोर पर असर डालने के लिए, अपने स्कीमा में RetrievalImportance को तय करें. ज़्यादा RetrievalImportance वाली प्रॉपर्टी से मैच करने पर, आपको ज़्यादा स्कोर मिलता है.
उदाहरण के लिए, अगर आपने सॉफ़्टवेयर में हुई गड़बड़ियों का इतिहास सेव किया है, तो उपयोगकर्ता गड़बड़ी के नाम से क्वेरी कर सकते हैं.
नाम के लिए RetrievalImportance को HIGHEST पर सेट करें. ब्यौरे के लिए, DEFAULT इस्तेमाल करें.
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" }
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": { "importance": "DEFAULT" }
}
}
]
}
]
}
एचटीएमएल दस्तावेज़ों के लिए, <title> और <h1> जैसे टैग से, शब्द की अहमियत का पता चलता है. अगर ContentFormat
TEXT है, तो ItemContent
DEFAULT के हिसाब से इस्तेमाल होता है. अगर यह HTML है, तो अहमियत एचटीएमएल प्रॉपर्टी पर निर्भर करती है.
डेटा अपडेट होने की फ़्रीक्वेंसी
अपडेट होने की तारीख से यह पता चलता है कि किसी आइटम में आखिरी बार कब बदलाव किया गया था. इसके लिए, ItemMetadata में createTime और updateTime का इस्तेमाल किया जाता है.
पुराने आइटम को कम रैंक मिलती है.
FreshnessOptions में freshnessProperty और freshnessDuration को बदलकर, फ़ीड को अपडेट होने की फ़्रीक्वेंसी को बदला जा सकता है.
freshnessProperty की मदद से, updateTime के बजाय अपनी पसंद के मुताबिक तारीख या टाइमस्टैंप का इस्तेमाल किया जा सकता है. बग के लिए, समयसीमा का इस्तेमाल किया जा सकता है, ताकि जिन आइटम की तारीखें अभी की तारीख के सबसे करीब हैं उन्हें ज़्यादा रैंक मिले.
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": { "freshnessProperty": "duedate" }
}
}
]
}
freshnessDuration का इस्तेमाल करके यह बताएं कि किसी आइटम को कब पुराना माना जाता है. ज़्यादा वैल्यू, जैसे कि 100 साल, नयापन दिखाने की सुविधा को बंद कर देती है. यह कर्मचारी की प्रोफ़ाइल जैसे स्टैटिक डेटा के लिए फ़ायदेमंद है. खबरों के लिए, कम समयसीमा वाली वैल्यू का इस्तेमाल करें. जैसे, तीन दिन.
क्वालिटी पर असर डालने वाले फ़ैक्टर
क्वालिटी से पता चलता है कि कोई आइटम कितना सटीक है और कितना काम का है. SearchQualityMetadata का इस्तेमाल करके, 0 और 1 के बीच की कोई वैल्यू डालें.
ज़्यादा वैल्यू से रैंकिंग बेहतर होती है. उदाहरण के लिए, एचआर की ओर से तैयार किए गए फ़ायदों से जुड़े दस्तावेज़ों को बढ़ावा दिया जा सकता है.
{
"metadata": {
"searchQualityMetadata": { "quality": 1.0 }
}
}
फ़ील्ड टाइप का इस्तेमाल करके असर
OrderedRanking का इस्तेमाल करके, इनम या पूर्णांक प्रॉपर्टी के आधार पर रैंकिंग को बेहतर बनाया जा सकता है:
NO_ORDER(डिफ़ॉल्ट): इससे रैंकिंग पर कोई असर नहीं पड़ता.ASCENDING: ज़्यादा वैल्यू से रैंकिंग बेहतर होती है.DESCENDING: कम वैल्यू से रैंकिंग बेहतर होती है.
अगर बग की प्राथमिकता के लिए HIGH की वैल्यू 1 और LOW की वैल्यू 3 है, तो DESCENDING का इस्तेमाल करें. votes प्रॉपर्टी के लिए, ASCENDING का इस्तेमाल करें.
क्वेरी को बड़ा करके रैंकिंग पर असर डालना
क्वेरी एक्सपैंशन की सुविधा, समानार्थी शब्दों और स्पेलिंग का इस्तेमाल करके नतीजों को बेहतर बनाती है.
समानार्थक शब्दों का प्रयोगउपयोग करें
Cloud Search, समानार्थी शब्दों के लिए सार्वजनिक वेब कॉन्टेंट का इस्तेमाल करता है. संगठन के हिसाब से इस्तेमाल होने वाली शब्दावली के लिए, कस्टम समानार्थी शब्द भी तय किए जा सकते हैं. समानार्थी शब्द तय करना लेख पढ़ें.
स्पेलिंग का इस्तेमाल करना
Cloud Search, SpellResult में स्पेलिंग के सुझाव देता है.
यह दस्तावेज़ों को ढूंढने के लिए, वर्तनी में हुई गलतियों को समानार्थी शब्दों के तौर पर भी इस्तेमाल करता है.
Search ऐप्लिकेशन की सेटिंग के ज़रिए रैंकिंग पर असर डालना
Search Application, कॉन्टेक्स्ट के हिसाब से जानकारी देता है. इन सेटिंग का इस्तेमाल करके, रैंकिंग पर असर डाला जा सकता है.
स्कोरिंग कॉन्फ़िगरेशन में बदलाव करना
नई जानकारी या दिलचस्पी के मुताबिक सुविधा को बंद करने के लिए, ScoringConfig तय करें.
दिलचस्पी के हिसाब से कॉन्टेंट दिखाने की सुविधा बंद करने पर, मालिक और इंटरैक्शन बूस्ट हट जाते हैं. खोज के अनुभव को पसंद के मुताबिक बनाना लेख पढ़ें.
सोर्स कॉन्फ़िगरेशन में बदलाव करना
डेटा सोर्स लेवल की सेटिंग तय करें:
- सोर्स का महत्व:
HIGHके महत्व वाले सोर्स से मिले आइटम को ज़्यादा रैंक मिलती है. - क्राउडिंग: यह सुविधा, एक ही सोर्स से मिले नतीजों की संख्या को सीमित करती है. डिफ़ॉल्ट रूप से, यह संख्या तीन होती है. इससे यह पक्का किया जाता है कि नतीजे अलग-अलग सोर्स से मिले हों.
मनमुताबिक बनाना
मनमुताबिक बनाने की सुविधा, उपयोगकर्ता के हिसाब से नतीजों को प्राथमिकता देती है:
- आइटम का मालिकाना हक: इससे उपयोगकर्ता के मालिकाना हक वाले आइटम को बढ़ावा मिलता है.
- आइटम के साथ इंटरैक्शन: इससे उन आइटम को बढ़ावा मिलता है जिन्हें उपयोगकर्ता ने हाल ही में देखा है, जिनमें बदलाव किया है या जिन पर टिप्पणी की है.
- उपयोगकर्ता के क्लिक: इससे उन आइटम को बढ़ावा मिलता है जिन पर उपयोगकर्ता ने पहले क्लिक किया था. नतीजे के यूआरएल में बदलाव न करें, क्योंकि इसका इस्तेमाल यह डेटा इकट्ठा करने के लिए किया जाता है.
क्वेरी इंटरप्रिटेशन
क्वेरी इंटरप्रिटेशन सुविधा, स्कीमा की परिभाषाओं का इस्तेमाल करके उपयोगकर्ता की क्वेरी को स्ट्रक्चर्ड और ऑपरेटर पर आधारित क्वेरी में बदलती है. इससे कम कीवर्ड होने पर भी सटीक नतीजे मिलते हैं. क्वेरी को सही तरीके से समझने के लिए स्कीमा बनाना लेख पढ़ें.
आइटम की भाषा
Cloud Search, उन आइटम को कम प्राथमिकता देता है जिनकी भाषा, क्वेरी की भाषा से मेल नहीं खाती. RequestOptions में languageCode को उपयोगकर्ता की पसंद के मुताबिक सेट करें.
आइटम का कॉन्टेक्स्ट
क्वेरी के कॉन्टेक्स्ट से जुड़े आइटम की रैंकिंग बढ़ाने के लिए, contextAttributes का इस्तेमाल करें. जैसे, जगह या विभाग.
आइटम की लोकप्रियता
Cloud Search, उन आइटम को बढ़ावा देता है जिन पर उपयोगकर्ता हाल ही की क्वेरी में अक्सर क्लिक करते हैं. खोज के नतीजों में दिखने वाले यूआरएल में बदलाव न करें, क्योंकि इनका इस्तेमाल इन क्लिक को ट्रैक करने के लिए किया जाता है.
खोज की क्वालिटी से जुड़ी सेटिंग के बारे में खास जानकारी
यहां दी गई टेबल में, खोज के नतीजों की क्वालिटी से जुड़ी सेटिंग के बारे में खास जानकारी दी गई है:
स्कीमा सेटिंग
| सेटिंग | जगह | सुझाव | विवरण |
|---|---|---|---|
ItemContent |
ItemContent |
सुझाए गए | विषय की जानकारी |
RetrievalImportance |
RetrievalImportance |
सुझाए गए | विषय की जानकारी |
FreshnessOptions |
FreshnessOptions |
वैकल्पिक | डेटा अपडेट होने की फ़्रीक्वेंसी |
इंडेक्स करने की सेटिंग
| सेटिंग | जगह | सुझाव | विवरण |
|---|---|---|---|
createTime/updateTime |
ItemMetadata |
सुझाए गए | डेटा अपडेट होने की फ़्रीक्वेंसी |
contentLanguage |
ItemMetadata |
सुझाए गए | आइटम की भाषा |
owners |
ItemAcl |
सुझाए गए | आइटम का मालिकाना हक |
| कस्टम सिनोनिम | _dictionaryEntry |
सुझाए गए | समानार्थी शब्दों का इस्तेमाल करना |
quality |
SearchQualityMetadata |
वैकल्पिक | क्वालिटी पर असर |
| इटरेक्शन डेटा | interaction |
वैकल्पिक | आइटम से इंटरैक्शन |
OrderedRanking |
OrderedRanking |
वैकल्पिक | फ़ील्ड टाइप |
ऐप्लिकेशन की सेटिंग खोजना
| सेटिंग | जगह | सुझाव | विवरण |
|---|---|---|---|
| वैयक्तिकरण अक्षम करें | ScoringConfig |
सुझाए गए | मनमुताबिक बनाने की सुविधा |
| सोर्स का महत्व | SourceCrowdingConfig |
वैकल्पिक | सोर्स कॉन्फ़िगरेशन |
| क्राउडिंग | SourceCrowdingConfig |
वैकल्पिक | सोर्स कॉन्फ़िगरेशन |