ডেটা প্রকার এবং শব্দার্থিক প্রকার

যখন আপনি একটি কমিউনিটি সংযোগকারী তৈরি করেন, তখন স্কিমায় সংজ্ঞায়িত প্রতিটি ক্ষেত্রের জন্য একটি ডেটা টাইপ প্রয়োজন। ডেটা টাইপ ক্ষেত্রের আদিম ধরণ যেমন BOOLEAN , STRING , NUMBER ইত্যাদি সংজ্ঞায়িত করে।

ডেটা টাইপ ছাড়াও, লুকার স্টুডিও সিমান্টিক টাইপ ব্যবহার করে। সিমান্টিক টাইপগুলি ডেটা যে ধরণের তথ্য উপস্থাপন করে তা বর্ণনা করতে সাহায্য করে। উদাহরণস্বরূপ, NUMBER ডেটা টাইপ সহ একটি ক্ষেত্র অর্থগতভাবে মুদ্রার পরিমাণ বা শতাংশ উপস্থাপন করতে পারে এবং STRING ডেটা টাইপ সহ একটি ক্ষেত্র অর্থগতভাবে একটি শহর উপস্থাপন করতে পারে। কোন সিমান্টিক টাইপগুলি উপলব্ধ তা দেখতে, অনুগ্রহ করে সিমান্টিক টাইপ ডকুমেন্টেশনটি দেখুন।

কমিউনিটি কানেক্টর স্কিমা এবং লুকার স্টুডিও ক্ষেত্র

যখন আপনি আপনার কমিউনিটি সংযোগকারীর জন্য স্কিমা নির্ধারণ করেন, তখন প্রতিটি ক্ষেত্রের জন্য বিভিন্ন বৈশিষ্ট্য থাকে যা নির্ধারণ করবে যে লুকার স্টুডিওতে ক্ষেত্রটি কীভাবে উপস্থাপন এবং ব্যবহৃত হবে। উদাহরণস্বরূপ:

  • আপনার সংযোগকারী স্কিমাতে conceptType কে conceptType প্রপার্টি ব্যবহার করে সংজ্ঞায়িত করা হয়েছে। এই প্রপার্টি নির্ধারণ করে যে ফিল্ডটিকে ডাইমেনশন নাকি মেট্রিক হিসেবে বিবেচনা করা হবে। মেট্রিক্স এবং ডাইমেনশনের মধ্যে পার্থক্য সম্পর্কে একটি ব্যাখ্যা Dimensions and metrics-এ পাওয়া যাবে।
  • শব্দার্থিক ধরণটি হয় সংযোগকারী স্কিমাতে সংজ্ঞায়িত করা যেতে পারে, অথবা আপনার সংযোগকারীতে সংজ্ঞায়িত ডেটা টাইপ বৈশিষ্ট্য এবং আপনার সংযোগকারী দ্বারা প্রদত্ত ডেটা মানের উপর ভিত্তি করে লুকার স্টুডিও দ্বারা স্বয়ংক্রিয়ভাবে সনাক্ত করা যেতে পারে। এটি কীভাবে কাজ করে তার বিশদ বিবরণের জন্য স্বয়ংক্রিয় শব্দার্থিক ধরণ সনাক্তকরণ দেখুন।
  • অ্যাগ্রিগেশন টাইপ নির্ধারণ করে যে মেট্রিক মানগুলি (মাত্রা উপেক্ষা করা হয়) পুনরায় একত্রিত করা যাবে কিনা। semantics.isReaggregatable প্রোপার্টিটিকে true তে সেট করলে ডিফল্টভাবে SUM একত্রিতকরণ হবে, অন্যথায় এটি Auto তে সেট করা হবে। আপনি defaultAggregationType প্রোপার্টি ব্যবহার করে পুনরায় একত্রিতকরণযোগ্য ফিল্ডগুলির জন্য ম্যানুয়ালি ডিফল্ট একত্রিতকরণ টাইপ সেট করতে পারেন।

যখন আপনি লুকার স্টুডিওতে একটি সংযোগকারী ব্যবহার করে কনফিগার এবং সংযোগ করেন, তখন ফিল্ডস এডিটর উপরের বৈশিষ্ট্যগুলি কীভাবে সংজ্ঞায়িত করেছেন তার উপর ভিত্তি করে সংযোগকারীর জন্য সম্পূর্ণ স্কিমা দেখায়। যদি আপনি শব্দার্থিক প্রকারগুলি অন্তর্ভুক্ত করে থাকেন, তাহলে সেগুলি আপনার সংজ্ঞা অনুসারে প্রদর্শিত হবে। যদি আপনি স্বয়ংক্রিয় শব্দার্থিক প্রকার সনাক্তকরণ ব্যবহার করেন, তাহলে ক্ষেত্রগুলি সনাক্তকরণের মতো প্রদর্শিত হবে। ক্ষেত্র স্ক্রিন

শব্দার্থিক তথ্য নির্ধারণ করা

শব্দার্থিক তথ্য সেট করার দুটি উপায় আছে। আপনি হয় ম্যানুয়ালি ফিল্ড শব্দার্থবিদ্যা সেট করতে পারেন অথবা স্বয়ংক্রিয়ভাবে সনাক্ত করার জন্য লুকার স্টুডিওর উপর নির্ভর করতে পারেন।

উদাহরণস্বরূপ, যদি আপনার কাছে এমন একটি সংখ্যা থাকে যা অর্থগতভাবে মার্কিন ডলারকে প্রতিনিধিত্ব করে, তাহলে Looker Studio স্বয়ংক্রিয়ভাবে এই অর্থগত ধরণটি সনাক্ত করতে সক্ষম হবে না। এছাড়াও, স্বয়ংক্রিয় অর্থগত সনাক্তকরণের জন্য Looker Studio কে আপনার স্কিমার প্রতিটি ক্ষেত্রের জন্য ডেটা ফেচ কল করতে হবে। আপনি যদি ম্যানুয়ালি স্কিমা নির্দিষ্ট করেন, তাহলে কোনও ডেটা ফেচ কল করা হবে না। যদি আপনি আপনার ডেটার জন্য অর্থগত ধরণ (যেমন মুদ্রা, শতাংশ, তারিখ, ইত্যাদি) জানেন, তাহলে আমরা সঠিকতা এবং কর্মক্ষমতার কারণে স্কিমায় এটি স্পষ্টভাবে সেট করার পরামর্শ দিচ্ছি।

শব্দার্থিক প্রকারগুলি ম্যানুয়ালি সেট করা (প্রস্তাবিত)

যদি আপনি আপনার শব্দার্থিক প্রকারগুলি জানেন, তাহলে আপনি প্রতিটি স্কিমা ক্ষেত্রের জন্য semantics ম্যানুয়ালি সংজ্ঞায়িত করতে পারেন। আপনার কাছে উপলব্ধ বৈশিষ্ট্যগুলির সম্পূর্ণ বিবরণ ফিল্ড রেফারেন্স পৃষ্ঠায় পাওয়া যাবে। যদি আপনি ম্যানুয়াল শব্দার্থিক প্রকারগুলি সংজ্ঞায়িত করতে চান, তাহলে প্রতিটি ক্ষেত্রের জন্য semanticType এবং semanticGroup সংজ্ঞায়িত করার পরামর্শ দেওয়া হচ্ছে। এই বৈশিষ্ট্যগুলি ম্যানুয়ালি প্রদান করে, স্বয়ংক্রিয় শব্দার্থিক প্রকার সনাক্তকরণ প্রক্রিয়াটি চলবে না। যদি আপনি আপনার কিছু ক্ষেত্র ম্যানুয়ালি সেট করেন, কিন্তু সবগুলি নয়, তাহলে যেগুলি আপনি ডিফল্টভাবে নির্দিষ্ট করেন না সেগুলিকে ক্ষেত্রের জন্য নির্দিষ্ট dataType উপর নির্ভর করে Text , Number , অথবা Boolean এ সেট করুন।

নিচে একটি সহজ স্কিমার উদাহরণ দেওয়া হল যা ম্যানুয়ালি শব্দার্থিক ধরণ নির্ধারণ করে। Income মুদ্রা হিসেবে সেট করা হয় এবং Filing Year তারিখ হিসেবে সেট করা হয়।

ডেটা-স্টুডিও/সেমান্টিক্স.জিএস
const schema = [
  {
    name: "Income",
    label: "Income (in USD)",
    dataType: "NUMBER",
    semantics: {
      conceptType: "METRIC",
      semanticGroup: "CURRENCY",
      semanticType: "CURRENCY_USD",
    },
  },
  {
    name: "Filing Year",
    label: "Year in which you filed the taxes.",
    dataType: "STRING",
    semantics: {
      conceptType: "METRIC",
      semanticGroup: "DATE_OR_TIME",
      semanticType: "YEAR",
    },
  },
];

ম্যানুয়াল শব্দার্থিক প্রকারের সমস্যা সমাধান

যদি আপনি অন্তর্নিহিত ডেটার জন্য আপনার শব্দার্থিক প্রকারগুলি ভুলভাবে সেট করেন, তাহলে সেগুলি সঠিকভাবে কাজ করবে না। এটি পরীক্ষা করা কঠিন হতে পারে, তবে সমস্যাগুলি খুঁজে পেতে আপনি কিছু জিনিস করতে পারেন।

  1. আপনার ডেটা থেকে পুরোটা না দিয়ে ২ বা ৩টি সারি ফেরত দিন, তারপর ম্যানুয়ালি এটি পরীক্ষা করুন।
  2. লুকার স্টুডিওতে এমন একটি টেবিল তৈরি করুন যা শুধুমাত্র সেই ক্ষেত্রটি ব্যবহার করে যা আপনি পরীক্ষা করার চেষ্টা করছেন।
  3. Geo এবং Date ফিল্ডগুলিতে বিশেষ মনোযোগ দিন কারণ এগুলির ফর্ম্যাট সবচেয়ে কঠোর।

স্বয়ংক্রিয় শব্দার্থিক ধরণ সনাক্তকরণ

যদি আপনার স্কিমায় কোনও সিমেন্টিক টাইপ সংজ্ঞায়িত না করে থাকেন, তাহলে লুকার স্টুডিও ডেটা টাইপ প্রোপার্টি এবং আপনার কানেক্টর দ্বারা ফেরত দেওয়া ডেটা ভ্যালুর ফর্ম্যাটের উপর ভিত্তি করে স্বয়ংক্রিয়ভাবে সেগুলি সনাক্ত করার চেষ্টা করবে।

স্বয়ংক্রিয় সনাক্তকরণ প্রক্রিয়ার ধাপগুলি নিম্নরূপ:

  1. আপনার কমিউনিটি কানেক্টরের getSchema ফাংশনটি কার্যকর করে স্কিমার অনুরোধ করুন।
  2. সংযোগকারী স্কিমায় সংজ্ঞায়িত ক্ষেত্রের ব্যাচগুলির মাধ্যমে পুনরাবৃত্তি করুন এবং ক্ষেত্রগুলিতে getData অনুরোধ জারি করুন। getData অনুরোধগুলি sampleExtraction প্যারামিটারটি true সেট করে কার্যকর করা হয় যা নির্দেশ করে যে ডেটা অনুরোধগুলি শব্দার্থিক সনাক্তকরণের উদ্দেশ্যে।
  3. ফিল্ড ডেটা টাইপ এবং getData অনুরোধ থেকে প্রাপ্ত মানের ফর্ম্যাটের উপর ভিত্তি করে, ফিল্ডের সিমেন্টিক টাইপ সনাক্ত করুন।

স্বয়ংক্রিয় শব্দার্থিক ধরণ সনাক্তকরণ পরিচালনার বিকল্পগুলি

যখন লুকার স্টুডিও শব্দার্থিক সনাক্তকরণের উদ্দেশ্যে একটি কমিউনিটি সংযোগকারীর getData ফাংশনটি কার্যকর করে, তখন আগত অনুরোধে একটি sampleExtraction বৈশিষ্ট্য থাকবে যা true তে সেট করা হবে। আপনার সংযোগকারী দ্বারা ফেরত পাঠানো ডেটা শুধুমাত্র ক্ষেত্রের শব্দার্থিক ধরণ সনাক্ত করতে লুকার স্টুডিও ব্যবহার করে। যেহেতু মানটি অন্য কোনও উদ্দেশ্যে ব্যবহার করা হবে না, তাই এর জন্য আপনার বাহ্যিক উৎস থেকে প্রকৃত ডেটার প্রয়োজন হয় না।

আপনার কোডে শব্দার্থিক টাইপ সনাক্তকরণ উন্নত করার বিভিন্ন উপায় রয়েছে:

  • প্রস্তাবিত: পূর্বনির্ধারিত মানগুলি পাস করুন
    প্রতিটি ক্ষেত্রের জন্য একটি পূর্বনির্ধারিত মান প্রদান করুন যা ক্ষেত্রের জন্য শব্দার্থিক প্রকারকে সর্বোত্তমভাবে উপস্থাপন করে এবং লুকার স্টুডিও দ্বারা সঠিকভাবে সনাক্ত করা যায় বলে জানা যায়। উদাহরণস্বরূপ, যদি কোনও ক্ষেত্রের শব্দার্থিক প্রকারটি দেশ হয় তবে ইতালির জন্য IT মতো একটি মান প্রদান করুন। এই পদ্ধতির আরেকটি সুবিধা হল এটি অনেক দ্রুত কারণ এতে ডেটার জন্য আপনাকে তৃতীয় পক্ষের পরিষেবাতে HTTP অনুরোধ করতে হবে না।

  • শুধুমাত্র n রেকর্ডের সংখ্যা প্রদান করে
    আপনি যে থার্ড-পার্টি সার্ভিস থেকে ডেটা আনছেন, যদি ডেটা অনুরোধ করার সময় সারি সীমা সমর্থন করে, তাহলে সম্পূর্ণ ডেটা সেটের পরিবর্তে লুকার স্টুডিওতে সারিগুলির একটি ছোট উপসেট ফেরত দিন। এটি প্রতিটি সিমান্টিক ডিটেকশন অনুরোধের জন্য লুকার স্টুডিওতে আপনার প্রয়োজনীয় ডেটার পরিমাণ সীমিত করবে।

  • সমস্ত কলাম অনুরোধ করুন এবং প্রতিক্রিয়া ক্যাশে করুন
    যদি আপনি যে থার্ড-পার্টি সার্ভিস থেকে ডেটা আনছেন তার জন্য সমস্ত কলাম অনুরোধ করা সম্ভব হয়, তাহলে লুকার স্টুডিও থেকে প্রাপ্ত প্রথম সিমেন্টিক ডিটেকশন অনুরোধে সমস্ত কলাম আনুন এবং ফলাফল ক্যাশে করুন। পরবর্তী সিমেন্টিক ডিটেকশন অনুরোধের জন্য, থার্ড-পার্টি সার্ভিসে অতিরিক্ত HTTP অনুরোধ করার পরিবর্তে ক্যাশে থেকে কলামের মান আনুন।

  • আলাদা কিছু করো না।
    যেখানে sampleExtraction true তে সেট করা আছে, সেখানে আপনি কোনও নির্দিষ্ট ব্যবস্থা বাস্তবায়ন না করার সিদ্ধান্ত নিতে পারেন। এর ফলে Semantic Detection প্রক্রিয়া ধীর হয়ে যাবে কারণ Looker Studio-কে Semantic Detection প্রক্রিয়ার জন্য সমস্ত ডেটা আনতে হবে। এছাড়াও, এটি আপনার বাহ্যিক ডেটা উৎসে অনুরোধের হারকে প্রভাবিত করবে কারণ অনেক semantic detection অনুরোধ সমান্তরালভাবে কার্যকর করা হবে।

স্বয়ংক্রিয় শব্দার্থিক ধরণ সনাক্তকরণের জন্য স্বীকৃত বিন্যাস

তারিখ সময়
  • YYYY/MM/DD-HH:MM:SS
  • YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
  • YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
  • YYYYMMDD [HH:MM:SS[.uuuuuu]]
  • Sat, 24 May 2008 20:09:47 GMT
  • 2008-05-24T20:09:47Z
  • সময়: সেকেন্ড, মাইক্রো, মিলি এবং ন্যানোর জন্য যুগ।
জিও