समानार्थी शब्द (एक जैसे मतलब वाले) शब्द तय करें

आम तौर पर, किसी संगठन में किसी सिद्धांत या चीज़ के बारे में बताने के लिए, यूनीक शब्दावली या कई तरीके अपनाए जाते हैं. शब्दों की समानता तय करने के लिए, समानार्थी शब्द बनाने चाहिए, ताकि खोज करते समय उपयोगकर्ताओं को आइटम ढूंढने में मदद मिल सके.

समानार्थी शब्द, _dictionaryEntry लोकप्रिय स्कीमा के साथ आइटम को इंडेक्स करके तय किए जाते हैं.

_dictionaryEntry टाइप के आइटम में ये प्रॉपर्टी हो सकती हैं:

प्रॉपर्टी टाइप ब्यौरा ज़रूरी है?
_term string परिभाषित किया जाने वाला शब्द. सुझाई गई वैल्यू, बिना हाइफ़न वाले शब्दों या वाक्यांशों को होती हैं. ज़रूरी है
_synonym string (repeated) _term में बताई गई स्ट्रिंग से मेल खाने वाली क्वेरी में शामिल किए जाने वाले वैकल्पिक शब्द. ज़रूरी है
_onlyApplicableForAttachedSearchApplications boolean आपको डेटा सोर्स और खोज ऐप्लिकेशन के हिसाब से, समानार्थी शब्दों को ग्रुप में बांटने की सुविधा मिलती है. ज़्यादा जानकारी के लिए, डेटा सोर्स के हिसाब से समानार्थी शब्द तय करना देखें. ज़रूरी नहीं

जब कोई उपयोगकर्ता किसी क्वेरी में _term प्रॉपर्टी की वैल्यू शामिल करता है, तो लागू होने वाली क्वेरी, "शब्द या समानार्थी शब्द" बन जाती है. उदाहरण के लिए, अगर "scifi" शब्द को समानार्थी शब्द "science fiction" से परिभाषित किया गया है, तो "scifi" शब्द वाली क्वेरी, "scifi" या "science fiction." वाले आइटम से मेल खाती है

समानार्थी शब्द, दो-तरफ़ा नहीं लागू होते. अगर क्वेरी "science fiction," के लिए है, तो उस क्वेरी में कोई समानार्थी शब्द लागू नहीं होता है. क्वेरी में सिर्फ़ उन आइटम से मेल खाता है जिनमें "scifi" वाले "science fiction." आइटम मौजूद हैं.

दोनों शब्दों को आपस में बदलने लायक बनाने के लिए, हर शब्द को अलग-अलग तय करें:

टर्म समानार्थी शब्द
scifi science fiction
science fiction scifi

क्वेरी प्रोसेसिंग के दौरान, समानार्थी शब्द लागू करने से पहले, हाइफ़न और दूसरे विराम चिह्न हटा दिए जाते हैं. उपयोगकर्ता की क्वेरी "sci-fi" _term से मेल खाती है "sci fi." जिन शब्दों को उपयोगकर्ता हाइफ़न कर सकते हैं उनके समानार्थी शब्द बनाने के लिए, पहले _term को सामान्य करें, ताकि हाइफ़न के बजाय खाली सफ़ेद जगह का इस्तेमाल किया जा सके.

इस उदाहरण में आगे दी गई परिभाषाएं, उपयोगकर्ता क्वेरी के हिसाब से "sci-fi," "sci fi," "scifi," और "science fiction" को आपस में बदल सकती हैं:

टर्म समानार्थी शब्द
scifi science fiction, sci fi
sci fi science fiction, scifi
science fiction scifi, sci fi

डिफ़ॉल्ट रूप से, किसी भी डेटा सोर्स में मौजूद समानार्थी शब्द पूरे डोमेन पर लागू होते हैं. खास तौर पर, डेटा सोर्स पर ध्यान दिए बिना, सभी खोजों के लिए खोज ऐप्लिकेशन में समानार्थी शब्द लागू किए जाते हैं. अगर आपको डेटा सोर्स के हिसाब से समानार्थी शब्द चाहिए, तो डेटा सोर्स के हिसाब से समानार्थी शब्द तय करने वाला लेख पढ़ें.

Cloud Search SDK टूल का इस्तेमाल करके, दुनिया भर के लिए समानार्थी शब्द तय करें

शब्दों और उनके समानार्थी शब्दों को परिभाषित करने के लिए, कॉन्टेंट कनेक्टर SDK टूल का इस्तेमाल किया जा सकता है. कनेक्टर बनाने के निर्देश पाने के लिए, कॉन्टेंट कनेक्टर बनाना लेख पढ़ें.

नीचे दिया गया स्निपेट, CSV फ़ाइल रिकॉर्ड के आधार पर शब्द और समानार्थी शब्द को दर्शाने वाले RepositoryDoc को बनाने के बारे में बताता है:

DictionaryConnector.java
/**
 * Creates a document for indexing.
 *
 * For this connector sample, the created document is domain public
 *  searchable. The content is a simple text string.
 *
 * @param record The current CSV record to convert
 * @return the fully formed document ready for indexing
 */
private ApiOperation buildDocument(CSVRecord record) {
  // Extract term and synonyms from record
  String term = record.get(0);
  List<String> synonyms = StreamSupport.stream(record.spliterator(), false)
      .skip(1) // Skip term
      .collect(Collectors.toList());

  Multimap<String, Object> structuredData = ArrayListMultimap.create();
  structuredData.put("_term", term);
  structuredData.putAll("_synonym", synonyms);

  if (Configuration.getBoolean("dictionary.attachedToSearchApp", false).get()) {
    structuredData.put("_onlyApplicableForAttachedSearchApplications", true);
  }

  String itemName = String.format("dictionary/%s", term);

  // Using the SDK item builder class to create the item
  Item item =
      IndexingItemBuilder.fromConfiguration(itemName)
          .setItemType(IndexingItemBuilder.ItemType.CONTENT_ITEM)
          .setObjectType("_dictionaryEntry")
          .setValues(structuredData)
          .setAcl(DOMAIN_PUBLIC_ACL)
          .build();

  // Create the fully formed document
  return new RepositoryDoc.Builder()
      .setItem(item)
      .build();
}

समानार्थी शब्द तय करते समय, इन बातों का ध्यान रखें:

  • समानार्थी शब्दों वाली एंट्री को डोमेन सार्वजनिक होना ज़रूरी है. पिछले उदाहरण में, एीएल को DOMAIN_PUBLIC_ACL पर सेट करके ऐसा किया जाता है.
  • आपकी कॉन्फ़िगरेशन फ़ाइल के लिए ये प्रॉपर्टी नहीं तय की जानी चाहिए, क्योंकि ये आपके कोड में डोमेन की सार्वजनिक सेटिंग को बदल देती हैं:
    • defaultAcl.mode=FALLBACK
    • defaultAcl.public=true

खोज ऐप्लिकेशन-विशिष्ट समानार्थी शब्द परिभाषित करें

डिफ़ॉल्ट रूप से, सभी खोज ऐप्लिकेशन में सभी डेटा सोर्स पर समानार्थी शब्द लागू होते हैं.

हालांकि, मान लें कि आपके संगठन की इंजीनियरिंग और सेल्स टीम की अलग-अलग टीमें हैं और आपको हर टीम को अलग खोज अनुभव उपलब्ध कराना है. इसमें नौकरी के लिए खास तौर पर बने समानार्थी शब्द भी शामिल हैं. इस मामले में, एक सर्च ऐप्लिकेशन बनाया जा सकता है, जिसमें इंजीनियरिंग वाले डेटा सोर्स और समानार्थी शब्द (एक जैसे मतलब वाले शब्द) हों. साथ ही, दूसरा सर्च ऐप्लिकेशन, जिसमें बिक्री से जुड़े डेटा सोर्स और समानार्थी शब्द हों. इस लक्ष्य को पूरा करने के लिए, _onlyApplicableForAttachedSearchApplications=true का इस्तेमाल करके किसी खास डेटा सोर्स में हर समानार्थी शब्द को इंडेक्स करें. यह सेटिंग समानार्थी शब्दों को सीमित करती है, जैसे कि वे सिर्फ़ उन खोज ऐप्लिकेशन पर लागू की जाती हैं जिनमें कोई खास डेटा सोर्स शामिल होता है.

उदाहरण के लिए, पिछले कोड सैंपल में कोड की नीचे दी गई लाइन जोड़ने से यह पक्का होता है कि इंडेक्स किए गए समानार्थी शब्द, डेटा सोर्स के हिसाब से हैं:

structuredData.put("_onlyApplicableForAttachedSearchApplications", true);