डेटा टाइप और सिमैंटिक टाइप

कम्यूनिटी कनेक्टर बनाते समय, स्कीमा में तय किए गए हर फ़ील्ड के लिए, डेटा टाइप की ज़रूरत होती है. डेटा टाइप, फ़ील्ड के प्रिमिटिव टाइप को तय करता है. जैसे, BOOLEAN, STRING, NUMBER वगैरह.

डेटा टाइप के अलावा, Looker Studio, सिमैंटिक टाइप का भी इस्तेमाल करता है. सिमैंटिक टाइप से यह पता चलता है कि डेटा किस तरह की जानकारी दिखाता है. उदाहरण के लिए, NUMBER डेटा टाइप वाला फ़ील्ड, सिमैंटिक तौर पर मुद्रा की रकम या प्रतिशत को दिखा सकता है. वहीं, STRING डेटा टाइप वाला फ़ील्ड, सिमैंटिक तौर पर किसी शहर को दिखा सकता है. कौनसे सिमैंटिक टाइप उपलब्ध हैं, यह देखने के लिए कृपया सिमैंटिक टाइप का दस्तावेज़ देखें

कम्यूनिटी कनेक्टर का स्कीमा और Looker Studio के फ़ील्ड

कम्यूनिटी कनेक्टर के लिए स्कीमा तय करते समय, हर फ़ील्ड के लिए अलग-अलग प्रॉपर्टी होती हैं. इनसे यह तय होता है कि Looker Studio में फ़ील्ड को कैसे दिखाया जाएगा और उसका इस्तेमाल कैसे किया जाएगा. उदाहरण के लिए:

  • conceptType को conceptType प्रॉपर्टी का इस्तेमाल करके, कनेक्टर स्कीमा में तय किया जाता है. इस प्रॉपर्टी से यह तय होता है कि फ़ील्ड को डाइमेंशन के तौर पर माना जाए या मेट्रिक के तौर पर. मेट्रिक और डाइमेंशन के बीच अंतर के बारे में जानकारी, डाइमेंशन और मेट्रिक पर जाकर देखी जा सकती है.
  • सिमैंटिक टाइप को कनेक्टर स्कीमा में तय किया जा सकता है. इसके अलावा, Looker Studio इसे अपने-आप भी पहचान सकता है. ऐसा, कनेक्टर में तय की गई डेटा टाइप प्रॉपर्टी और कनेक्टर से मिले डेटा वैल्यू के आधार पर होता है. यह सुविधा कैसे काम करती है, इस बारे में जानने के लिए अपने-आप सिमैंटिक टाइप का पता लगाने की सुविधा लेख पढ़ें.
  • एग्रीगेशन टाइप से यह तय होता है कि मेट्रिक वैल्यू (डाइमेंशन को अनदेखा किया जाता है) को फिर से एग्रीगेट किया जा सकता है या नहीं. semantics.isReaggregatable प्रॉपर्टी को true पर सेट करने पर, डिफ़ॉल्ट रूप से SUM एग्रीगेशन का इस्तेमाल किया जाएगा. अगर ऐसा नहीं किया जाता है, तो इसे Auto पर सेट किया जाएगा. defaultAggregationType प्रॉपर्टी का इस्तेमाल करके, रीएग्रीगेट किए जा सकने वाले फ़ील्ड के लिए डिफ़ॉल्ट एग्रीगेशन टाइप को मैन्युअल तरीके से भी सेट किया जा सकता है.

Looker Studio में किसी कनेक्टर का इस्तेमाल करके कॉन्फ़िगर और कनेक्ट करने पर, फ़ील्ड एडिटर, कनेक्टर का पूरा स्कीमा दिखाता है. यह इस बात पर निर्भर करता है कि आपने ऊपर दी गई प्रॉपर्टी कैसे तय की हैं. अगर आपने सिमैंटिक टाइप शामिल किए हैं, तो वे आपकी तय की गई सेटिंग के हिसाब से दिखेंगे. अगर सिमैंटिक टाइप का अपने-आप पता लगाने की सुविधा का इस्तेमाल किया जा रहा है, तो फ़ील्ड वैसे ही दिखेंगे जैसे उनका पता लगाया गया था. फ़ील्ड स्क्रीन

सिमेंटिक जानकारी सेट की जा रही है

सिमैंटिक जानकारी सेट करने के दो तरीके हैं. फ़ील्ड के सिमैंटिक को मैन्युअल तरीके से सेट किया जा सकता है. इसके अलावा, Looker Studio को अपने-आप इसका पता लगाने दिया जा सकता है.

उदाहरण के लिए, अगर आपके पास कोई ऐसा नंबर है जो सेमैंटिक तौर पर अमेरिकी डॉलर को दिखाता है, तो Looker Studio इस सेमैंटिक टाइप का अपने-आप पता नहीं लगा पाएगा. इसके अलावा, सिमैंटिक का अपने-आप पता लगाने की सुविधा के लिए, Looker Studio को आपके स्कीमा के हर फ़ील्ड के लिए, डेटा फ़ेच करने के अनुरोध करने होते हैं. अगर आपने स्कीमा को मैन्युअल तरीके से तय किया है, तो डेटा फ़ेच करने के लिए कोई कॉल नहीं किया जाएगा. अगर आपको अपने डेटा के सिमैंटिक टाइप (जैसे, मुद्रा, प्रतिशत, तारीख वगैरह) के बारे में पता है, तो हम आपको सलाह देते हैं कि इसे स्कीमा में साफ़ तौर पर सेट करें. इससे, सटीक जानकारी और बेहतर परफ़ॉर्मेंस मिलेगी.

सिमैंटिक टाइप को मैन्युअल तरीके से सेट करना (सुझाया गया)

अगर आपको अपने सिमैंटिक टाइप के बारे में पता है, तो हर स्कीमा फ़ील्ड के लिए मैन्युअल तरीके से semantics तय किया जा सकता है. आपको कौनसी प्रॉपर्टी उपलब्ध हैं, इसकी पूरी जानकारी फ़ील्ड रेफ़रंस पेज पर मिलेगी. अगर आपको मैन्युअल तरीके से सिमैंटिक टाइप तय करने हैं, तो हमारा सुझाव है कि हर फ़ील्ड के लिए semanticType और semanticGroup तय करें. इन प्रॉपर्टी को मैन्युअल तरीके से उपलब्ध कराने पर, सिमैंटिक टाइप का अपने-आप पता लगाने की प्रोसेस नहीं चलेगी. अगर आपने कुछ फ़ील्ड को मैन्युअल तरीके से सेट किया है, लेकिन सभी को नहीं, तो जिन फ़ील्ड के लिए आपने कोई वैल्यू नहीं दी है उनके लिए डिफ़ॉल्ट वैल्यू Text, Number या Boolean सेट हो जाएगी. यह इस बात पर निर्भर करता है कि फ़ील्ड के लिए dataType की वैल्यू क्या दी गई है.

यहां एक सामान्य स्कीमा का उदाहरण दिया गया है, जिसमें सिमैंटिक टाइप को मैन्युअल तरीके से सेट किया गया है. Income को मुद्रा और Filing Year को तारीख के तौर पर सेट किया गया है.

data-studio/semantics.gs
var schema = [
  {
    'name': 'Income',
    'label': 'Income (in USD)',
    'dataType': 'NUMBER',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'CURRENCY',
      'semanticType': 'CURRENCY_USD'
    }
  }, {
    'name': 'Filing Year',
    'label': 'Year in which you filed the taxes.',
    'dataType': 'STRING',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'DATE_OR_TIME',
      'semanticType': 'YEAR'
    }
  }
];

मैन्युअल सिमैंटिक टाइप से जुड़ी समस्याओं को हल करना

अगर आपने डेटा के लिए सेमैंटिक टाइप गलत तरीके से सेट किए हैं, तो वे ठीक से काम नहीं करेंगे. इसकी जांच करना मुश्किल हो सकता है. हालांकि, समस्याओं का पता लगाने के लिए, कुछ तरीके अपनाए जा सकते हैं.

  1. अपने डेटा की सभी लाइनों के बजाय, सिर्फ़ दो या तीन लाइनें दिखाएं. इसके बाद, मैन्युअल तरीके से उनकी जांच करें.
  2. Looker Studio में एक ऐसी टेबल बनाएं जिसमें सिर्फ़ उस फ़ील्ड का इस्तेमाल किया गया हो जिसकी आपको जांच करनी है.
  3. Geo और Date फ़ील्ड पर खास ध्यान दें, क्योंकि इनका फ़ॉर्मैट सबसे ज़्यादा सख्त होता है.

सिमैंटिक टाइप का अपने-आप पता लगने की सुविधा

अगर आपने अपने स्कीमा में कोई सिमैंटिक टाइप तय नहीं किया है, तो Looker Studio उन्हें अपने-आप पता लगाने की कोशिश करेगा. ऐसा डेटा टाइप प्रॉपर्टी और आपके कनेक्टर से मिली डेटा वैल्यू के फ़ॉर्मैट के आधार पर किया जाएगा.

अपने-आप पता लगाने की प्रोसेस के चरण यहां दिए गए हैं:

  1. अपने कम्यूनिटी कनेक्टर के getSchema फ़ंक्शन को लागू करके, स्कीमा का अनुरोध करें.
  2. कनेक्टर स्कीमा में तय किए गए फ़ील्ड के बैच को दोहराता है और फ़ील्ड के लिए getData अनुरोध जारी करता है. getData अनुरोधों को sampleExtraction पैरामीटर के साथ लागू किया जाता है. इसे true पर सेट किया जाता है, ताकि यह पता चल सके कि डेटा के अनुरोध, सिमैंटिक डिटेक्शन के मकसद से किए गए हैं.
  3. फ़ील्ड के डेटा टाइप और getData अनुरोध से मिली वैल्यू के फ़ॉर्मैट के आधार पर, फ़ील्ड के सिमैंटिक टाइप की पहचान करें.

सिमैंटिक टाइप की अपने-आप पहचान होने की सुविधा को मैनेज करने के विकल्प

जब Looker Studio, सिमैंटिक डिटेक्शन के लिए कम्यूनिटी कनेक्टर के getData फ़ंक्शन को लागू करता है, तो आने वाले अनुरोध में sampleExtraction प्रॉपर्टी शामिल होगी. इसे true पर सेट किया जाएगा. आपका कनेक्टर जो डेटा दिखाता है उसका इस्तेमाल सिर्फ़ Looker Studio करता है. इससे वह फ़ील्ड के सिमैंटिक टाइप की पहचान करता है. इस वैल्यू का इस्तेमाल किसी अन्य मकसद के लिए नहीं किया जाएगा. इसलिए, इसके लिए आपके बाहरी सोर्स से मिले असल डेटा की ज़रूरत नहीं है.

अपने कोड में सिमैंटिक टाइप का पता लगाने की सुविधा को बेहतर बनाने के कई तरीके हैं:

  • सुझाया गया: पहले से तय की गई वैल्यू पास करें
    हर फ़ील्ड के लिए, पहले से तय की गई ऐसी वैल्यू दिखाएं जो फ़ील्ड के सिमैंटिक टाइप को सबसे सही तरीके से दिखाती हो. साथ ही, Looker Studio को इस वैल्यू का पता हो. उदाहरण के लिए, अगर किसी फ़ील्ड का सिमैंटिक टाइप देश है, तो इटली के लिए IT जैसी वैल्यू दिखाएं. इस तरीके का एक और फ़ायदा यह है कि यह बहुत तेज़ी से काम करता है. ऐसा इसलिए, क्योंकि इसके लिए आपको तीसरे पक्ष की सेवा से डेटा पाने के लिए, एचटीटीपी अनुरोध करने की ज़रूरत नहीं होती.

  • सिर्फ़ n रिकॉर्ड दिखाएं
    अगर डेटा का अनुरोध करते समय, डेटा फ़ेच करने वाली तीसरे पक्ष की सेवा, पंक्तियों की सीमा तय करने की सुविधा देती है, तो पूरे डेटा सेट के बजाय, Looker Studio को पंक्तियों का छोटा सबसेट दिखाएं. इससे, हर सिमैंटिक डिटेक्शन अनुरोध के लिए, Looker Studio को भेजे जाने वाले डेटा की मात्रा सीमित हो जाएगी.

  • सभी कॉलम के लिए अनुरोध करें और जवाब को कैश मेमोरी में सेव करें
    अगर तीसरे पक्ष की उस सेवा के लिए सभी कॉलम का अनुरोध किया जा सकता है जिससे डेटा फ़ेच किया जा रहा है, तो Looker Studio से मिले पहले सिमैंटिक डिटेक्शन अनुरोध पर सभी कॉलम फ़ेच करें और नतीजों को कैश मेमोरी में सेव करें. इसके बाद, सिमैंटिक डिटेक्शन के अनुरोधों के लिए, तीसरे पक्ष की सेवा को अतिरिक्त एचटीटीपी अनुरोध भेजने के बजाय, कैश मेमोरी से कॉलम की वैल्यू फ़ेच करें.

  • कोई बदलाव न करें
    आपके पास उन अनुरोधों के लिए, किसी खास सुविधा को लागू न करने का विकल्प होता है जहां sampleExtraction को true पर सेट किया गया है. इससे, सिमैंटिक डिटेक्शन की प्रोसेस धीमी हो जाएगी. ऐसा इसलिए होगा, क्योंकि Looker Studio को सिमैंटिक डिटेक्शन की प्रोसेस के लिए, पूरा डेटा फ़ेच करना होगा. इसके अलावा, इससे आपके बाहरी डेटा सोर्स के लिए अनुरोध की दर पर भी असर पड़ेगा, क्योंकि सिमैंटिक डिटेक्शन के कई अनुरोध एक साथ पूरे किए जाएंगे.

सिमेंटिक टाइप का अपने-आप पता लगाने के लिए, पहचाने गए फ़ॉर्मैट

तारीख और समय
  • YYYY/MM/DD-HH:MM:SS
  • YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
  • YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
  • YYYYMMDD [HH:MM:SS[.uuuuuu]]
  • Sat, 24 May 2008 20:09:47 GMT
  • 2008-05-24T20:09:47Z
  • समय: सेकंड, माइक्रो, मिली, और नैनो के लिए epoch.
Geo