डेटा टाइप और सिमैंटिक टाइप

कम्यूनिटी कनेक्टर बनाते समय, स्कीमा में तय किए गए हर फ़ील्ड के लिए, डेटा टाइप की ज़रूरत होती है. डेटा टाइप से, फ़ील्ड के प्रिमिटिव टाइप के बारे में पता चलता है. जैसे, BOOLEAN, STRING, NUMBER वगैरह.

डेटा टाइप के अलावा, Looker Studio, सिमैंटिक टाइप का भी इस्तेमाल करता है. सिमैंटिक टाइप से यह पता चलता है कि डेटा किस तरह की जानकारी दिखाता है. उदाहरण के लिए, NUMBER डेटा टाइप वाला फ़ील्ड, सिमैंटिक तौर पर मुद्रा की रकम या प्रतिशत को दिखा सकता है. वहीं, STRING डेटा टाइप वाला फ़ील्ड, सिमैंटिक तौर पर किसी शहर को दिखा सकता है. यह देखने के लिए कि कौनसे सिमैंटिक टाइप उपलब्ध हैं, कृपया सिमैंटिक टाइप का दस्तावेज़ देखें

कम्यूनिटी कनेक्टर का स्कीमा और Looker Studio के फ़ील्ड

कम्यूनिटी कनेक्टर के लिए स्कीमा तय करते समय, हर फ़ील्ड के लिए अलग-अलग प्रॉपर्टी होती हैं. इनसे यह तय होता है कि Looker Studio में फ़ील्ड को कैसे दिखाया जाएगा और उसका इस्तेमाल कैसे किया जाएगा. उदाहरण के लिए:

conceptType को कनेक्टर स्कीमा में conceptType प्रॉपर्टी का इस्तेमाल करके तय किया जाता है. इस प्रॉपर्टी से यह तय होता है कि फ़ील्ड को डाइमेंशन के तौर पर माना जाएगा या मेट्रिक के तौर पर. मेट्रिक और डाइमेंशन के बीच अंतर के बारे में जानकारी, डाइमेंशन और मेट्रिक में देखी जा सकती है.
सिमैंटिक टाइप को कनेक्टर स्कीमा में तय किया जा सकता है. इसके अलावा, Looker Studio इसे अपने-आप भी पहचान सकता है. ऐसा, कनेक्टर में तय की गई डेटा टाइप प्रॉपर्टी और कनेक्टर से मिले डेटा वैल्यू के आधार पर होता है. यह सुविधा कैसे काम करती है, इस बारे में जानने के लिए सिमैंटिक टाइप का अपने-आप पता लगाने की सुविधा लेख पढ़ें.
एग्रीगेशन टाइप से यह तय होता है कि मेट्रिक वैल्यू (डाइमेंशन को अनदेखा किया जाता है) को फिर से एग्रीगेट किया जा सकता है या नहीं. semantics.isReaggregatable प्रॉपर्टी को true पर सेट करने पर, डिफ़ॉल्ट रूप से SUM एग्रीगेशन का इस्तेमाल किया जाएगा. ऐसा न करने पर, इसे Auto पर सेट किया जाएगा. defaultAggregationType प्रॉपर्टी का इस्तेमाल करके, रीएग्रीगेट किए जा सकने वाले फ़ील्ड के लिए डिफ़ॉल्ट एग्रीगेशन टाइप को मैन्युअल तरीके से भी सेट किया जा सकता है.

Looker Studio में किसी कनेक्टर का इस्तेमाल करके कॉन्फ़िगर और कनेक्ट करने पर, फ़ील्ड एडिटर, कनेक्टर का पूरा स्कीमा दिखाता है. यह इस बात पर निर्भर करता है कि आपने ऊपर दी गई प्रॉपर्टी कैसे तय की हैं. अगर आपने सिमैंटिक टाइप शामिल किए हैं, तो वे आपकी तय की गई सेटिंग के हिसाब से दिखेंगे. अगर सिमैंटिक टाइप का अपने-आप पता लगाने की सुविधा का इस्तेमाल किया जा रहा है, तो फ़ील्ड वैसे ही दिखेंगे जैसे उनका पता लगाया गया था. फ़ील्ड स्क्रीन

ध्यान दें: आपके कम्यूनिटी कनेक्टर में तय की गई स्कीमा प्रॉपर्टी, डिफ़ॉल्ट सेटिंग के तौर पर इस्तेमाल की जाती हैं. ऐसा तब होता है, जब उपयोगकर्ता कोई डेटा सोर्स बनाते हैं. उपयोगकर्ता, एग्रीगेशन टाइप को छोड़कर किसी भी प्रॉपर्टी को बदल सकता है. हालांकि, ऐसा सिर्फ़ तब किया जा सकता है, जब एग्रीगेशन टाइप को अपने-आप होने वाला एग्रीगेशन पर सेट न किया गया हो.

सिमेंटिक जानकारी सेट की जा रही है

सिमैंटिक जानकारी सेट करने के दो तरीके हैं. फ़ील्ड के सिमैंटिक को मैन्युअल तरीके से सेट किया जा सकता है. इसके अलावा, Looker Studio पर भी भरोसा किया जा सकता है, ताकि वह अपने-आप इसका पता लगा सके.

उदाहरण के लिए, अगर आपके पास कोई ऐसा नंबर है जो डॉलर को दिखाता है, तो Looker Studio इस सिमैंटिक टाइप का अपने-आप पता नहीं लगा पाएगा. इसके अलावा, सिमैंटिक का अपने-आप पता लगाने की सुविधा के लिए, Looker Studio को आपके स्कीमा के हर फ़ील्ड के लिए, डेटा फ़ेच करने के अनुरोध करने होते हैं. अगर आपने स्कीमा को मैन्युअल तरीके से तय किया है, तो डेटा फ़ेच करने के लिए कोई कॉल नहीं किया जाएगा. अगर आपको अपने डेटा के सिमैंटिक टाइप (जैसे, मुद्रा, प्रतिशत, तारीख वगैरह) के बारे में पता है, तो हम आपको सलाह देते हैं कि इसे स्कीमा में साफ़ तौर पर सेट करें. इससे, डेटा सटीक होगा और परफ़ॉर्मेंस बेहतर होगी.

सिमैंटिक टाइप को मैन्युअल तरीके से सेट करना (सुझाया गया)

अगर आपको अपने सिमैंटिक टाइप के बारे में पता है, तो हर स्कीमा फ़ील्ड के लिए मैन्युअल तरीके से semantics तय किया जा सकता है. आपको कौनसी प्रॉपर्टी उपलब्ध हैं, इसकी पूरी जानकारी फ़ील्ड रेफ़रंस पेज पर मिलेगी. अगर आपको मैन्युअल तरीके से सिमैंटिक टाइप तय करने हैं, तो हमारा सुझाव है कि हर फ़ील्ड के लिए semanticType और semanticGroup तय करें. इन प्रॉपर्टी को मैन्युअल तरीके से उपलब्ध कराने पर, सिमैंटिक टाइप का अपने-आप पता लगाने की प्रोसेस नहीं चलेगी. अगर आपने कुछ फ़ील्ड को मैन्युअल तरीके से सेट किया है, लेकिन सभी को नहीं, तो जिन फ़ील्ड के लिए आपने कोई वैल्यू नहीं दी है उनके लिए डिफ़ॉल्ट वैल्यू Text, Number या Boolean सेट हो जाएगी. यह वैल्यू, फ़ील्ड के लिए तय की गई dataType पर निर्भर करती है.

यहां एक सामान्य स्कीमा का उदाहरण दिया गया है. इसमें सिमैंटिक टाइप को मैन्युअल तरीके से सेट किया गया है. Income को मुद्रा के तौर पर और Filing Year को तारीख के तौर पर सेट किया गया है.

data-studio/semantics.gs

GitHub पर देखें

const schema = [
  {
    name: "Income",
    label: "Income (in USD)",
    dataType: "NUMBER",
    semantics: {
      conceptType: "METRIC",
      semanticGroup: "CURRENCY",
      semanticType: "CURRENCY_USD",
    },
  },
  {
    name: "Filing Year",
    label: "Year in which you filed the taxes.",
    dataType: "STRING",
    semantics: {
      conceptType: "METRIC",
      semanticGroup: "DATE_OR_TIME",
      semanticType: "YEAR",
    },
  },
];

मैन्युअल सिमैंटिक टाइप से जुड़ी समस्याओं को हल करना

अगर आपने डेटा के लिए सेमैंटिक टाइप गलत तरीके से सेट किए हैं, तो वे ठीक से काम नहीं करेंगे. इसकी जांच करना मुश्किल हो सकता है. हालांकि, समस्याओं का पता लगाने के लिए, यहां दिए गए कुछ तरीके आज़माए जा सकते हैं.

अपने डेटा की सभी लाइनों के बजाय, सिर्फ़ दो या तीन लाइनें दिखाएं. इसके बाद, मैन्युअल तरीके से उनकी जांच करें.
Looker Studio में एक ऐसी टेबल बनाएं जिसमें सिर्फ़ उस फ़ील्ड का इस्तेमाल किया गया हो जिसकी आपको जांच करनी है.
Geo और Date फ़ील्ड पर खास ध्यान दें, क्योंकि इनका फ़ॉर्मैट सबसे ज़्यादा सख्त होता है.

सिमैंटिक टाइप का अपने-आप पता लगाने की सुविधा

अगर आपने अपने स्कीमा में कोई सिमैंटिक टाइप तय नहीं किया है, तो Looker Studio उन्हें अपने-आप पता लगाने की कोशिश करेगा. ऐसा डेटा टाइप प्रॉपर्टी और आपके कनेक्टर से मिली डेटा वैल्यू के फ़ॉर्मैट के आधार पर किया जाएगा.

अपने-आप पता लगाने की प्रोसेस के चरण यहां दिए गए हैं:

अपने कम्यूनिटी कनेक्टर के getSchema फ़ंक्शन को लागू करके, स्कीमा का अनुरोध करें.
कनेक्टर स्कीमा में तय किए गए फ़ील्ड के बैच को दोहराता है और फ़ील्ड के लिए getData अनुरोध जारी करता है. getData अनुरोधों को sampleExtraction पैरामीटर के साथ true पर सेट करके लागू किया जाता है. इससे यह पता चलता है कि डेटा के अनुरोध, सिमैंटिक डिटेक्शन के मकसद से किए गए हैं.
फ़ील्ड के डेटा टाइप और getData अनुरोध से मिली वैल्यू के फ़ॉर्मैट के आधार पर, फ़ील्ड के सिमैंटिक टाइप की पहचान करें.

सिमैंटिक टाइप का अपने-आप पता लगाने की सुविधा को मैनेज करने के विकल्प

जब Looker Studio, सिमैंटिक डिटेक्शन के लिए कम्यूनिटी कनेक्टर के getData फ़ंक्शन को लागू करता है, तो आने वाले अनुरोध में sampleExtraction प्रॉपर्टी शामिल होगी. इसे true पर सेट किया जाएगा. आपका कनेक्टर जो डेटा दिखाता है उसका इस्तेमाल सिर्फ़ Looker Studio करता है. इससे वह फ़ील्ड के सिमैंटिक टाइप की पहचान करता है. इस वैल्यू का इस्तेमाल किसी और मकसद के लिए नहीं किया जाएगा. इसलिए, इसके लिए आपके बाहरी सोर्स से मिले असल डेटा की ज़रूरत नहीं है.

अपने कोड में सिमैंटिक टाइप का पता लगाने की सुविधा को बेहतर बनाने के कई तरीके हैं:

सुझाया गया: पहले से तय की गई वैल्यू पास करें
हर फ़ील्ड के लिए, पहले से तय की गई ऐसी वैल्यू दिखाएं जो फ़ील्ड के सिमैंटिक टाइप को सबसे सही तरीके से दिखाती हो. साथ ही, Looker Studio को इस वैल्यू का पता सही तरीके से चलता हो. उदाहरण के लिए, अगर किसी फ़ील्ड का सिमैंटिक टाइप Country है, तो इटली के लिए IT जैसी वैल्यू दिखाएं. इस तरीके का एक और फ़ायदा यह है कि यह बहुत तेज़ी से काम करता है. ऐसा इसलिए, क्योंकि इसके लिए आपको तीसरे पक्ष की सेवा को डेटा के लिए एचटीटीपी अनुरोध करने की ज़रूरत नहीं होती.
सिर्फ़ n रिकॉर्ड दिखाएं
अगर डेटा का अनुरोध करते समय, डेटा फ़ेच करने वाली तीसरे पक्ष की सेवा, पंक्तियों की सीमा तय करने की सुविधा देती है, तो पूरे डेटा सेट के बजाय Looker Studio को पंक्तियों का छोटा सबसेट दिखाएं. इससे, आपको हर सिमैंटिक डिटेक्शन अनुरोध के लिए, Looker Studio को कम डेटा भेजना होगा.
सभी कॉलम के लिए अनुरोध करें और जवाब को कैश मेमोरी में सेव करें
अगर तीसरे पक्ष की उस सेवा के लिए सभी कॉलम का अनुरोध किया जा सकता है जिससे डेटा फ़ेच किया जा रहा है, तो Looker Studio से मिले पहले सिमैंटिक डिटेक्शन अनुरोध पर सभी कॉलम फ़ेच करें और नतीजों को कैश मेमोरी में सेव करें. इसके बाद, सिमैंटिक डिटेक्शन के अनुरोधों के लिए, तीसरे पक्ष की सेवा को अतिरिक्त एचटीटीपी अनुरोध करने के बजाय, कैश मेमोरी से कॉलम की वैल्यू फ़ेच करें.
कोई बदलाव न करें
आपके पास उन अनुरोधों के लिए, किसी खास सुविधा को लागू न करने का विकल्प होता है जहां sampleExtraction को true पर सेट किया गया है. इससे, सिमैंटिक डिटेक्शन की प्रोसेस धीमी हो जाएगी. ऐसा इसलिए होगा, क्योंकि Looker Studio को सिमैंटिक डिटेक्शन की प्रोसेस के लिए, पूरा डेटा फ़ेच करना होगा. इसके अलावा, इससे आपके बाहरी डेटा सोर्स के लिए अनुरोध की दर पर भी असर पड़ेगा. ऐसा इसलिए, क्योंकि सिमैंटिक डिटेक्शन के कई अनुरोध एक साथ पूरे किए जाएंगे.

सिमेंटिक टाइप का अपने-आप पता लगाने के लिए, पहचाने गए फ़ॉर्मैट

तारीख और समय

YYYY/MM/DD-HH:MM:SS
YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
YYYYMMDD [HH:MM:SS[.uuuuuu]]
Sat, 24 May 2008 20:09:47 GMT
2008-05-24T20:09:47Z
समय: सेकंड, माइक्रो, मिली, और नैनो के लिए epoch.

Geo

महाद्वीप का नाम या कोड
उपमहाद्वीप का नाम या कोड
इलाके का नाम या कोड
देश का नाम या कोड. इसके अलावा, ISO_3166-1 देखें.
शहर का नाम
कॉमा लगाकर अलग की गई अक्षांश और देशांतर की वैल्यू
खास तौर पर बनाए गए बाज़ार (डीएमए) का नाम और कोड