DSPL মানে ডেটাসেট পাবলিশিং ল্যাঙ্গুয়েজ। এটি মেটাডেটা (ডেটাসেট সম্পর্কে তথ্য, যেমন এর নাম এবং প্রদানকারী, সেইসাথে এতে থাকা ধারণা এবং প্রদর্শন) এবং ডেটাসেটের প্রকৃত ডেটা উভয়ের জন্যই একটি উপস্থাপনা বিন্যাস। এই বিন্যাসে বর্ণিত ডেটাসেটগুলি Google পাবলিক ডেটা এক্সপ্লোরার- এ আমদানি করা যেতে পারে, একটি টুল যা ডেটার সমৃদ্ধ, ভিজ্যুয়াল অনুসন্ধানের অনুমতি দেয়৷
দ্রষ্টব্য: পাবলিক ডেটা আপলোড টুল ব্যবহার করে Google পাবলিক ডেটাতে ডেটা আপলোড করতে, আপনার একটি Google অ্যাকাউন্ট থাকতে হবে।
এই দস্তাবেজটি সেই সমস্ত ডেটা মালিকদের জন্য যারা তাদের বিষয়বস্তু পাবলিক ডেটা এক্সপ্লোরারে উপলব্ধ করতে চান৷ এটি DSPL স্কিমা এবং সমর্থিত বৈশিষ্ট্যগুলির বিশদ বিবরণে গভীরভাবে ডুব দিয়ে টিউটোরিয়ালের বাইরে চলে যায়। XML-এর শুধুমাত্র একটি প্রাথমিক পরিচিতি ধরে নেওয়া হয়, যদিও রিলেশনাল ডাটাবেসের জ্ঞানও দরকারী।
যদিও এটি প্রয়োজনীয় নয়, আমরা এই নথিটি দেখার আগে টিউটোরিয়ালটি পড়ার পরামর্শ দিই, যা ছোট এবং সহজে হজম হয়৷
ওভারভিউ
একটি DSPL ডেটাসেট হল একটি .zip ফাইল যাতে একটি XML ফাইল এবং CSV ফাইলের একটি সেট থাকে। CSV ফাইলগুলি হল সাধারণ টেবিল যাতে ডেটাসেটের ডেটা থাকে, যখন XML ফাইল ডেটাসেটের মেটাডেটা বর্ণনা করে৷ পরবর্তীতে তথ্যগত মেটাডেটা যেমন পরিমাপের বর্ণনা, সেইসাথে টেবিলের মধ্যে রেফারেন্সের মতো কাঠামোগত মেটাডেটা অন্তর্ভুক্ত। এই মেটাডেটা অ-বিশেষজ্ঞ ব্যবহারকারীদের আপনার ডেটা অন্বেষণ এবং কল্পনা করতে দেয়।
প্রক্রিয়া
সাধারণভাবে, একটি DSPL ডেটাসেট তৈরির প্রক্রিয়াটি নিম্নরূপ (কিছু পদক্ষেপ সমান্তরালভাবে ঘটতে পারে):
- আপনার DSPL XML ফাইল তৈরি করুন।
- আপনার ডেটাসেটে ব্যবহার করার জন্য কোনও বাহ্যিক ডেটা উত্স সনাক্ত করুন৷
- আপনার ধারণা, স্লাইস, এবং (ঐচ্ছিকভাবে) বিষয়গুলি সংজ্ঞায়িত করুন। পুনরাবৃত্তিমূলকভাবে আপনার DSPL ফাইলের বিষয়বস্তু আপডেট করুন।
- আপনার উৎস ডেটা .csv ফাইলগুলিতে রপ্তানি করুন৷
- একটি DSPL ডেটাসেট তৈরি করুন।
- Google-এ ডেটাসেট জমা দিন।
XML স্ট্রাকচার
ওভারভিউ
DSPL XML ফাইলটি ধারণা, স্লাইস, বিষয় এবং টেবিলের মধ্যে কাঠামোগত সম্পর্ক সহ ডেটাসেটের মেটাডেটা সংজ্ঞায়িত করে। যদিও এই ফাইলটি হাতে তৈরি করা সম্ভব, তথ্য প্রক্রিয়াকরণ সরঞ্জাম এবং স্ক্রিপ্টগুলি প্রক্রিয়াটিকে ব্যাপকভাবে প্রবাহিত করতে পারে। একটি নতুন উইন্ডোতে একটি নমুনা DSPL ফাইল দেখুন ।
ফাইলটিতে বেশ কয়েকটি বিভাগ রয়েছে, যা নীচের সারণীতে সংক্ষিপ্ত করা হয়েছে। সারণী অনুসরণ করে, আমরা প্রাক্তন প্রতিটিকে আরও বিশদে বর্ণনা করি।
| ধারা | সারাংশ | আরো তথ্য |
|---|---|---|
| হেডার এবং আমদানি | ডেটাসেটের অন্যান্য উপাদানগুলির জন্য অভিভাবক৷ ডেটাসেটের জন্য টার্গেট নেমস্পেস (অর্থাৎ, শনাক্তকারী) অন্তর্ভুক্ত করে, সাথে যেকোনো আমদানি করা ডেটাসেটের নামস্থান। | ডকুমেন্টেশন |
| ডেটাসেট তথ্য | ডেটাসেটের নাম, বিবরণ এবং URL। | ডকুমেন্টেশন |
| প্রদানকারী তথ্য | ডেটাসেট প্রদানকারীর নাম, বিবরণ এবং URL। | ডকুমেন্টেশন |
| ধারণা | ডেটাসেটে প্রদর্শিত "জিনিস" এর সংজ্ঞা (যেমন, দেশ, বেকারত্বের হার, লিঙ্গ, ইত্যাদি) প্রতিটি ধারণার একটি অনন্য শনাক্তকারী রয়েছে, যা স্লাইস এবং টেবিল দ্বারা উল্লেখ করা যেতে পারে। | ডকুমেন্টেশন |
| স্লাইস | ধারণাগুলির সংমিশ্রণ যার জন্য ডেটাসেটে পরিসংখ্যানগত ডেটা রয়েছে৷ প্রতিটি স্লাইসে মাত্রা এবং মেট্রিক্স রয়েছে। স্লাইস রেফারেন্স ধারণা এবং এছাড়াও টেবিল, যা প্রকৃত তথ্য ধারণ করে। প্রতিটি স্লাইসের একটি অনন্য শনাক্তকারী রয়েছে যা প্রকৃত ডেটা ধারণকারী টেবিল দ্বারা উল্লেখ করা যেতে পারে। | ডকুমেন্টেশন |
| টেবিল | ধারণা এবং স্লাইসের জন্য ডেটা সংজ্ঞায়িত করুন। কনসেপ্ট টেবিল গণনা ধারণ করে এবং স্লাইস টেবিলে পরিসংখ্যানগত তথ্য থাকে। টেবিলগুলি XML ফাইলে সংজ্ঞায়িত করা হয় এবং প্রকৃত ডেটা ধারণকারী .csv ফাইলগুলির দিকে নির্দেশ করে৷ | ডকুমেন্টেশন |
| বিষয় | ডেটাসেট ধারণাগুলি সংগঠিত করার জন্য বিভাগগুলি৷ প্রয়োজন না হলেও, এগুলি আপনার ডেটা নেভিগেট করার জন্য ব্যবহারকারীদের জন্য খুব সহায়ক হতে পারে৷ | ডকুমেন্টেশন |
হেডার এবং আমদানি
পাবলিক ডেটা নামস্থান ঘোষণা করা হচ্ছে
একটি DSPL ডেটাসেট একটি শীর্ষ-স্তরের, <dspl> উপাদান দিয়ে শুরু হয়। এটি সমস্ত ডেটাসেট তথ্য আবদ্ধ করতে এবং ফাইল জুড়ে ব্যবহার করা হবে এমন কোনও নামস্থান নির্দেশ করতে ব্যবহৃত হয়। এখানে উদাহরণ:
<?xml version="1.0" encoding="UTF-8"?>
<dspl targetNamespace="http://www.example.com/mystats"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns="http://schemas.google.com/dspl/2010" >
...
</dspl> একটি নামস্থান হল একটি অনন্য শনাক্তকারী যা একটি XML স্কিমার সাথে যুক্ত হতে পারে (এক্সএমএল উপাদান এবং বৈশিষ্ট্যগুলির একটি সেট)। targetNamespace একটি URI প্রদান করে যা আপনার ডেটাসেটকে শনাক্ত করে। এই URI-এর কোনো প্রকৃত সম্পদের দিকে নির্দেশ করার প্রয়োজন নেই, তবে আপনার বিষয়বস্তু বা ডেটাসেট বর্ণনা করে এমন একটি নথিতে URI সমাধান করা একটি ভালো ধারণা।
আপনাকে একটি targetNamespace প্রদান করতে হবে না। যদি আপনি না করেন, তাহলে আমদানির সময় আপনার জন্য একটি স্বয়ংক্রিয়ভাবে তৈরি হবে।
targetNamespace অ্যাট্রিবিউটটি ফাইলে ব্যবহার করা হবে এমন অন্যান্য এক্সএমএল স্কিমা নির্দিষ্ট করে xmlns অ্যাট্রিবিউটের একটি সিরিজ দ্বারা অনুসরণ করা হয়। প্রতিটি DSPL ফাইলে অবশ্যই Google পাবলিক ডেটা স্কিমা অন্তর্ভুক্ত করতে হবে, যার URI হল "http://schemas.google.com/dspl/2010" এবং এটিকে ডিফল্ট নেমস্পেস হিসেবে ব্যবহার করুন৷ এটিতে "http://www.w3.org/2001/XMLSchema-instance" দ্বারা চিহ্নিত স্ট্যান্ডার্ড, W3 XML স্কিমা অন্তর্ভুক্ত করা উচিত। পরবর্তী বিভাগে বর্ণিত হিসাবে, অন্যান্য ডেটাসেট থেকে তথ্য অন্তর্ভুক্ত করার জন্য অন্যান্য নেমস্পেস যোগ করা যেতে পারে।
অন্যান্য ডেটাসেট নামস্থান আমদানি করা হচ্ছে
ডেটাসেট অন্যান্য ডেটাসেট থেকে সংজ্ঞা এবং ডেটা পুনরায় ব্যবহার করতে পারে। উদাহরণস্বরূপ, গুগল অনেকগুলি মৌলিক ডেটাসেট সরবরাহ করে যা সাধারণত ব্যবহারকারীর ডেটাতে উপস্থিত ধারণাগুলিকে সংজ্ঞায়িত করে। উদাহরণস্বরূপ, বেশিরভাগ ডেটাসেটের বছরগুলিকে উপস্থাপন করার জন্য একটি ধারণা প্রয়োজন। একটি নতুন ধারণা সংজ্ঞায়িত করার পরিবর্তে, আপনি "http://www.google.com/publicdata/dataset/time" ডেটাসেট থেকে বছরের ধারণাটি ব্যবহার করতে পারেন৷ আরও তথ্যের জন্য ক্যানোনিকাল ধারণা পৃষ্ঠা দেখুন।
একটি বহিরাগত ডেটাসেট ব্যবহার করতে, নামস্থান ঘোষণার ঠিক পরে DSPL ফাইলে <import> উপাদান যোগ করুন এবং আপনি যে ডেটাস্পেস আমদানি করছেন তা নির্দেশ করুন, এইভাবে:
<import namespace="http://www.google.com/publicdata/dataset/google/time"/>
তারপর, আপনার ফাইলের শীর্ষে নামস্থান ঘোষণায় আমদানি করা নামস্থান (এই ক্ষেত্রে, time="http://www.google.com/publicdata/dataset/google/time" ) যুক্ত করুন, এইভাবে:
<?xml version="1.0" encoding="UTF-8"?> <dspl targetNamespace="http://www.stats-bureau.com/mystats" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://schemas.google.com/dspl/2010" xmlns:time="http://www.google.com/publicdata/dataset/google/time" > <import namespace="http://www.google.com/publicdata/dataset/google/time"/>
আপনার DSPL ফাইলটি এখন Google পাবলিক ডেটা টাইম ডেটাসেট থেকে উপাদানগুলি উল্লেখ করতে পারে৷ আপনি উল্লেখ করতে চান এমন প্রতিটি ডেটাসেটের জন্য এই প্রক্রিয়াটি পুনরাবৃত্তি করুন।
বাহ্যিক ডেটাসেটে বিষয়বস্তু উল্লেখ করা
একবার আপনি অন্য ডেটাসেট আমদানি করলে, আপনাকে সেই ডেটাসেট থেকে ধারণা, স্লাইস এবং ডেটা উল্লেখ করতে সক্ষম হতে হবে। এটি করার জন্য, আপনি ফর্ম্যাট prefix:other_id , যেখানে prefix বহিরাগত ডেটাসেটের নামস্থানের জন্য ব্যবহৃত উপসর্গ।
এখানে time ডেটাসেট থেকে year ধারণার একটি রেফারেন্সের একটি উদাহরণ (উপরে বর্ণিত):
<slices>
<slice id="country_slice">
<dimension concept="country"/>
<dimension concept="time:year"/>
<metric concept="population"/>
<table ref="country_slice_table"/>
</slice>
...
</slices>ডেটাসেট তথ্য
<info> উপাদানটিতে ডেটাসেট সম্পর্কে বর্ণনামূলক তথ্য রয়েছে। প্রাসঙ্গিক XML উপাদানগুলির একটি উদাহরণ এবং বিবরণ নীচে তালিকাভুক্ত করা হয়েছে৷
উদাহরণ
<info> <name> <value>Unemployment Rates</value> </name> <description> <value>Worldwide unemployment rates by region</value> </description> <url> <value>http://www.example.com/mystats/info.html</value> </url> </info>
উপাদান
| উপাদান | প্রয়োজন? | বর্ণনা |
|---|---|---|
<info> | হ্যাঁ | ডেটাসেট সম্পর্কে সমস্ত বর্ণনামূলক তথ্য সংযুক্ত করে। চাইল্ড উপাদানগুলি অন্তর্ভুক্ত করে <name> , <description> , এবং <url> । |
<name> | হ্যাঁ | <info> এর সন্তান। চাইল্ড উপাদান <value> অন্তর্ভুক্ত করে, যা ডেটাসেটের নাম শনাক্ত করে। |
<description> | ঐচ্ছিক | <info> এর সন্তান। চাইল্ড উপাদান <value> অন্তর্ভুক্ত করে, যার মধ্যে ডেটাসেটের একটি পাঠ্য বিবরণ রয়েছে। |
<url> | হ্যাঁ | <info> এর সন্তান। ডেটাসেট সম্পর্কে আরও তথ্য সহ একটি URL এর একটি লিঙ্ক৷ |
প্রদানকারী তথ্য
<provider> উপাদান ডেটাসেট প্রদানকারী সম্পর্কে তথ্য তালিকাভুক্ত করে। প্রাসঙ্গিক XML উপাদানগুলির একটি উদাহরণ এবং বিবরণ নীচে তালিকাভুক্ত করা হয়েছে৷
উদাহরণ
<provider>
<name>
<value>Bureau of Statistics</value>
</name>
<url>
<value>http://www.example.com</value>
</url>
</provider>উপাদান
| উপাদান | প্রয়োজন? | বর্ণনা |
|---|---|---|
<provider> | হ্যাঁ | ডেটাসেট প্রদানকারী সম্পর্কে সমস্ত বর্ণনামূলক তথ্য সংযুক্ত করে। চাইল্ড উপাদান <name> এবং <url> অন্তর্ভুক্ত করে। |
<name> | ঐচ্ছিক | <provider> এর সন্তান। চাইল্ড উপাদান <value> অন্তর্ভুক্ত করে, যা ডেটাসেট প্রদানকারীর নাম শনাক্ত করে। |
<url> | ঐচ্ছিক | <info> এর সন্তান। ডেটাসেট প্রদানকারী সম্পর্কে আরও তথ্য সহ একটি URL এর একটি লিঙ্ক৷ |
ধারণা
বর্ণনা
প্রতিটি ডেটাসেটে এক বা একাধিক ধারণা থাকে। একটি ধারণা হল এক ধরণের ডেটার সংজ্ঞা যা একটি ডেটাসেটে প্রদর্শিত হয়। ডেমোগ্রাফিক জনসংখ্যার ডেটা সহ একটি ডেটাসেট, উদাহরণস্বরূপ, দেশ, রাজ্য, জনসংখ্যা এবং বছর ধারণা থাকতে পারে। একটি প্রদত্ত ধারণার সাথে সম্পর্কিত ডেটা মানগুলিকে সেই ধারণার দৃষ্টান্ত বলা হয়। ধারণাগুলি সাধারণত ডেটাসেটে বর্ণনা করা হয়, তবে কিছু ধারণা (যেমন সময় বা বছর) বহিরাগত ডেটাসেটে বর্ণনা করা যেতে পারে।
প্রতিটি ধারণার এক বা একাধিক বৈশিষ্ট্য থাকতে পারে। একটি সম্পত্তি একটি ধারণা উদাহরণের একটি বৈশিষ্ট্য যা সময়ের সাথে স্থিতিশীল। উদাহরণস্বরূপ, দেশের ধারণার বৈশিষ্ট্যের name , population এবং capital থাকতে পারে।
ধারণার এক বা একাধিক বৈশিষ্ট্যও থাকতে পারে। বৈশিষ্ট্যগুলি ধারণার স্তরে তথ্য প্রদান করে, এর পৃথক দৃষ্টান্ত নয়। উদাহরণস্বরূপ, যদি আমাদের কাছে বেকারত্বের হারের ধারণা সহ একটি ডেটাসেট থাকে, তাহলে আমরা একটি বৈশিষ্ট্য ব্যবহার করতে পারি যে এই ধারণাটি একটি শতাংশ। বৈশিষ্ট্যগুলির একটি সাধারণ ব্যবহারের আরেকটি উদাহরণ হল ইউনিট তথ্য প্রদান করা।
উদাহরণ
এখানে অনন্য আইডি country এবং সম্পত্তির name সহ একটি দেশের ধারণার একটি উদাহরণ। ধারণা আইডিটি স্লাইস এবং টেবিল থেকে ধারণাটি উল্লেখ করতে ব্যবহার করা যেতে পারে।
<concept id="country" extends="geo:location"> <info> <name><value>Country</value></name> <description> <value>My list of countries.</value> </description> </info> <type ref="string"/> <property id="name"> <info> <name><value>Name</value></name> <description> <value>The official name of the country</value> </description> </info> <type ref="string" /> </property> <property concept="geo:continent" isParent="true"/> <property id="capital" concept="geo:city" /> <table ref="countries_table" /> </concept>
এখানে এই উদাহরণ কিভাবে কাজ করে.
- এই কোডটি ধারণার দেশ বর্ণনা করে, যার আইডি
countryএবং বৈশিষ্ট্যেরname,continentএবংcapitalরয়েছে। - ধারণাটি
geo:location, অবস্থানের জন্য আদর্শ ধারণাকে প্রসারিত করে।geo:locationপ্রসারিত করার মাধ্যমে,countryবর্ধিত ধারণা দ্বারা সংজ্ঞায়িত সমস্ত বৈশিষ্ট্য এবং গুণাবলীর উত্তরাধিকারী হয়: বৈশিষ্ট্যের নাম, বিবরণ, url, অক্ষাংশ এবং দ্রাঘিমাংশ। যতক্ষণ না বর্ধিত ধারণার দ্বারা প্রদত্ত সংজ্ঞাটির সাথে সামঞ্জস্যপূর্ণ থাকে ততক্ষণcountryজন্য এই বৈশিষ্ট্য এবং বৈশিষ্ট্যগুলির মধ্যে কয়েকটিকে পুনরায় সংজ্ঞায়িত করা ঠিক আছে। - ধারণা
<info>উপাদান ধারণা সম্পর্কে মূল তথ্য বর্ণনা করে। এটি পাবলিক ডেটা এক্সপ্লোরারে ডেটাসেটের ল্যান্ডিং পৃষ্ঠায় প্রদর্শিত হয়। - ধারণা
<type>উপাদান সামগ্রীর ধরন বোঝায়। এই ক্ষেত্রে এটি স্ট্রিং, কিন্তু এই পরিবর্তিত হতে পারে. ধারণা জনসংখ্যার টাইপintegerথাকবে; ধারণাEurovision winnerটাইপ বুলিয়ান থাকতে পারে। - একটি
<property>উপাদান ধারণার প্রতিটি বৈশিষ্ট্য বর্ণনা করে, এর অনন্য ID (id),infoএবংtypeসহ। বৈশিষ্ট্যগুলি ধারণাগুলিকেও উল্লেখ করতে পারে, এটি নির্দেশ করতে যে তাদের মানগুলি সেই ধারণাগুলির বৈধ উদাহরণ। ধারণাটি একটি ডেটা টেবিলের উল্লেখ করে যা প্রকৃত ডেটা ধারণকারী CSV ফাইলের দিকে নির্দেশ করে। ডেটা টেবিলটি এইভাবে উল্লেখ করা হয়েছে:
<table ref="countries_table"/>।যদি আপনার ধারণা একটি টেবিলের উল্লেখ করে, তাহলে সংশ্লিষ্ট ডেটা ফাইলটিকে অবশ্যই ধারণার সমস্ত উদাহরণ তালিকাভুক্ত করতে হবে। আপনি, উদাহরণস্বরূপ, একটি টেবিল তৈরি করতে পারবেন না যা ডেটাসেটে অন্তর্ভুক্ত দেশগুলির মধ্যে কয়েকটি তালিকা করে। (যদি আপনার পছন্দের দেশগুলির একটি উপসেট থাকে তবে আপনি তাদের বর্ণনা করার জন্য একটি পৃথক ধারণা তৈরি করতে পারেন৷ উদাহরণস্বরূপ,
mycountries৷)
উপাদান
| উপাদান | প্রয়োজন? | বর্ণনা |
|---|---|---|
<concepts> | হ্যাঁ | শীর্ষ-স্তরের উপাদান। সমস্ত <concept> উপাদানকে আবদ্ধ করে। |
<concept> | হ্যাঁ | ধারণা চিহ্নিত করে। প্রয়োজনীয় অ্যাট্রিবিউট id মান অবশ্যই ডেটাসেটের মধ্যে থাকা ধারণার জন্য অনন্য হতে হবে। যদি ধারণাটি একটি ধারণা ডেটা টেবিলের উল্লেখ করে, তাহলে id মান অবশ্যই ডেটা টেবিলের ধারণাটি বর্ণনাকারী কলাম শিরোনামের সাথে মিলবে। একটি extends বৈশিষ্ট্য বোঝাতে ব্যবহার করা যেতে পারে যে এই ধারণাটি অন্য ধারণাকে প্রসারিত করে। extends মান অবশ্যই একই ডেটাসেটে সংজ্ঞায়িত একটি ধারণার আইডির সাথে মিলিত হতে হবে বা ফর্ম prefix:concept_id , যেখানে concept_id হল prefix সাথে যুক্ত আমদানি করা বহিরাগত ডেটাসেটে সংজ্ঞায়িত একটি ধারণার আইডি। |
<info> | ঐচ্ছিক | ধারণা সম্পর্কে বর্ণনামূলক তথ্য সংযুক্ত করে। |
<name> | হ্যাঁ | <info> এর সন্তান। ধারণার নাম। চাইল্ড এলিমেন্ট <value> পাঠ্য রয়েছে - উদাহরণস্বরূপ, Country । |
<description> | ঐচ্ছিক | <info> এর সন্তান। শিশু উপাদান <value> অন্তর্ভুক্ত করে, যার মধ্যে ধারণাটির একটি পাঠ্য বিবরণ রয়েছে। |
<url> | ঐচ্ছিক | <info> এর সন্তান। চাইল্ড এলিমেন্ট অন্তর্ভুক্ত করে <value> , যা ধারণার জন্য একটি URL অন্তর্ভুক্ত করে। |
<pluralName> | ঐচ্ছিক | <info> এর সন্তান। ধারণার বহুবচন নাম। চাইল্ড উপাদান <value> টেক্সট ধারণ করে - উদাহরণস্বরূপ, Countries । |
<totalName> | ঐচ্ছিক | <info> এর সন্তান। ধারণার সমস্ত দৃষ্টান্তের সমন্বয়ের নাম। চাইল্ড এলিমেন্ট <value> পাঠ্য রয়েছে- একটি country ধারণার ক্ষেত্রে, উদাহরণস্বরূপ, এটি World হতে পারে। |
<type> | ঐচ্ছিক | ধারণা দ্বারা বর্ণিত বিষয়বস্তুর ধরন সনাক্ত করে। প্রয়োজনীয় অ্যাট্রিবিউট ref নিম্নলিখিত অনুমোদিত মান রয়েছে:
|
<property> | ঐচ্ছিক | ধারণার একটি সম্পত্তি, যেমন একটি প্রপার্টিতে একটি বুলিয়ান ধারণার দৃষ্টান্ত এবং সম্পত্তির মানগুলির মধ্যে একটি 1-1 ম্যাপিং রয়েছে তা বোঝাতে একটি সম্পত্তিতে একটি বুলিয়ান একটি সম্পত্তি একটি নেস্টেড |
<attribute> | ঐচ্ছিক | ধারণার একটি বৈশিষ্ট্য। বৈশিষ্ট্যগুলি ধারণা সম্পর্কে অতিরিক্ত তথ্য উপস্থাপন করে (যেমন, জিডিপি একটি শতাংশ)। প্রয়োজনীয় অ্যাট্রিবিউট একটি বৈশিষ্ট্য একটি নেস্টেড |
<table> | ঐচ্ছিক | ধারণার জন্য ডেটা ধারণকারী ডেটা টেবিল সনাক্ত করে। প্রয়োজনীয় ref অ্যাট্রিবিউটের মান অবশ্যই সম্পর্কিত <table> উপাদানে নির্দিষ্ট করা টেবিল আইডির সাথে মেলে। |
স্লাইস
বর্ণনা
একটি স্লাইস ধারণাগুলির একটি সমন্বয় যার জন্য ডেটা বিদ্যমান। একটি স্লাইসে দুটি ধরণের ধারণার রেফারেন্স রয়েছে: মাত্রা এবং মেট্রিক্স । একটি মাত্রা হল একটি ধারণা যা আপনার ডেটা বিভাগ বা ফিল্টার করতে ব্যবহৃত হয়। একটি মেট্রিক, অন্যদিকে, প্রতিটি ডেটা পয়েন্টের সাথে সম্পর্কিত পর্যবেক্ষণ করা মান বা মানগুলিকে বর্ণনা করে।
সাধারণত, মাত্রাগুলি শ্রেণীবদ্ধ যেখানে মেট্রিকগুলি অ-শ্রেণীগত, সময়-পরিবর্তনশীল, সংখ্যাসূচক মান। প্রতিটির কিছু প্রোটোটাইপিকাল উদাহরণ নিম্নরূপ:
- মাত্রা : দেশ, রাজ্য, কাউন্টি, অঞ্চল, বছর, মাস, লিঙ্গ, বয়স বিভাগ, শিল্প বিভাগ
- মেট্রিক্স : জনসংখ্যা, জিডিপি, বেকারত্বের হার, সাক্ষরতা, রাজস্ব, খরচ, মূল্য
উদাহরণ
<slices>
<slice id="country_slice">
<dimension concept="country"/>
<dimension concept="time:year"/>
<metric concept="population"/>
<table ref="country_slice_table"/>
</slice>
...
</slices>এখানে এই উদাহরণ কিভাবে কাজ করে.
- এই স্লাইস দেশ অনুসারে জনসংখ্যার প্রতিনিধিত্ব করে।
- এটির মেট্রিক
population, এবং মাত্রাcountryএবংyearরয়েছে। প্রতিটি মাত্রা ইতিমধ্যেই অন্যত্র সংজ্ঞায়িত একটি ধারণা। ধারণারcountryএবং মেট্রিকpopulationবর্তমান স্লাইসের মতো একই ডেটাসেটে বিদ্যমান এবং এইভাবে উল্লেখ করা হয়েছে:concept="country" - ধারণার
yearআমদানি করা ডেটাসেট সময়ের মধ্যে বিদ্যমান, ধারণার নামের আগে ব্যবহৃত উপসর্গ দ্বারা চিহ্নিত (year), এইভাবে:concept="time:year" - স্লাইসটি একটি ডেটা টেবিলের উল্লেখ করে যা প্রকৃত ডেটা ধারণকারী CSV ফাইলের দিকে নির্দেশ করে। ডেটা টেবিলটি এইভাবে উল্লেখ করা হয়েছে:
<table ref="country_slice_table"/>। ( ডেটাসেট আমদানির তথ্যের জন্য উপরে দেখুন।)
দ্রষ্টব্য: সাধারণভাবে, আপনার ডেটাসেট আরও নমনীয় হবে যদি আপনি মেট্রিক্সকে ন্যূনতম রাখেন এবং পরিবর্তে অর্থপূর্ণ মাত্রা তৈরি করেন। উদাহরণস্বরূপ, Female Unemployment এবং Male Unemployment মেট্রিকগুলি তৈরি করার পরিবর্তে, একক মেট্রিক Unemployment তৈরি করুন এবং Gender মাত্রা যোগ করুন যেখানে Female এবং Male উদাহরণ রয়েছে৷
উপাদান
| উপাদান | প্রয়োজন? | বর্ণনা |
|---|---|---|
<slices> | হ্যাঁ | শীর্ষ-স্তরের উপাদান। সমস্ত <slice> উপাদানগুলিকে আবদ্ধ করে। |
<slice> | ঐচ্ছিক | স্লাইস সনাক্ত করে। প্রয়োজনীয় অ্যাট্রিবিউট id মান অবশ্যই স্লাইসের জন্য অনন্য হতে হবে। |
<dimension> | ঐচ্ছিক | একটি ধারণা উল্লেখ করে, স্লাইসের একটি মাত্রা সংজ্ঞায়িত করে। প্রয়োজনীয় অ্যাট্রিবিউট concept মান অবশ্যই কনসেপ্টের ইউনিক আইডির সাথে মিলতে হবে এবং কনসেপ্টটি যদি এক্সটার্নাল ইম্পোর্ট করা ডেটাসেটের অন্তর্গত হয় তাহলে একটি বৈধ উপসর্গ ব্যবহার করতে হবে। |
<metric> | ঐচ্ছিক | একটি ধারণা উল্লেখ করে, স্লাইসের একটি মেট্রিক সংজ্ঞায়িত করে। প্রয়োজনীয় অ্যাট্রিবিউট concept মান অবশ্যই কনসেপ্টের ইউনিক আইডির সাথে মিলতে হবে এবং কনসেপ্টটি যদি এক্সটার্নাল ইম্পোর্ট করা ডেটাসেটের অন্তর্গত হয় তাহলে একটি বৈধ উপসর্গ ব্যবহার করতে হবে। |
<table> | হ্যাঁ | স্লাইসের জন্য ডেটা ধারণকারী ডেটা টেবিল সনাক্ত করে। প্রয়োজনীয় ref অ্যাট্রিবিউটের মান অবশ্যই সম্পর্কিত <table> উপাদানে নির্দিষ্ট করা টেবিল আইডির সাথে মেলে। |
<mapDimension> | ঐচ্ছিক | <table> এর সন্তান। বৈশিষ্ট্য concept এবং toColumn ধারণ করে; প্রথমটির মানটি স্লাইসের একটি মাত্রা এবং দ্বিতীয়টির মানটি পূর্বের সাথে সামঞ্জস্যপূর্ণ টেবিল কলাম৷ |
<mapMetric> | ঐচ্ছিক | <table> এর সন্তান। বৈশিষ্ট্য concept এবং toColumn ধারণ করে; প্রথমটির মানটি স্লাইসের একটি মেট্রিক এবং দ্বিতীয়টির মানটি পূর্বের সাথে সামঞ্জস্যপূর্ণ টেবিল কলাম। |
টেবিল
বর্ণনা
DSPL ফাইলের tables বিভাগটি ডেটাসেটে অন্তর্ভুক্ত ডেটা টেবিল চিহ্নিত করে। এই টেবিলগুলি ধারণা দ্বারা বা স্লাইস দ্বারা উল্লেখ করা যেতে পারে। প্রতিটি <table> উপাদান টেবিলের কলাম এবং তাদের প্রকারগুলি নির্দিষ্ট করে, এবং টেবিলের ডেটা ধারণকারী একটি CSV ফাইলের দিকে নির্দেশ করে।
উদাহরণ
<tables> <table id="country_slice_table"> <column id="country" type="string"/> <column id="year" type="date" format="yyyy"/> <column id="population" type="integer"/> <data> <file format="csv" encoding="utf-8">country_slice.csv</file> </data> </table> ... </tables>
এই নমুনা কাজ কিভাবে এখানে.
- এই নমুনা
country_slice_tableবর্ণনা করে। সারণিতেcountry,yearএবংpopulationকলাম রয়েছে। - টেবিলের প্রতিটি কলামের একটি অনন্য আইডি রয়েছে, যা
idবৈশিষ্ট্য দ্বারা সংজ্ঞায়িত করা হয়েছে। এই আইডিটি অবশ্যই সংশ্লিষ্ট ডেটা ফাইলের উপযুক্ত কলাম শিরোনামের সাথে ঠিক মেলে। - ঐচ্ছিক
typeঅ্যাট্রিবিউটের মান প্রতিটি কলামের জন্য ডেটা টাইপ নির্ধারণ করে। -
<data>উপাদানটি টেবিলের ডেটা ধারণকারী প্রকৃত .csv ফাইল (country_slice.csv) বর্ণনা করে। ফাইল ফরম্যাট সবসময়csvহয়।
উপাদান
| উপাদান | প্রয়োজন? | বর্ণনা |
|---|---|---|
<tables> | হ্যাঁ | শীর্ষ-স্তরের উপাদান। সমস্ত <table> উপাদানগুলিকে আবদ্ধ করে। |
<table> | হ্যাঁ | টেবিল সনাক্ত করে। প্রয়োজনীয় অ্যাট্রিবিউট id মান অবশ্যই টেবিলে অনন্য হতে হবে। |
<column> | ঐচ্ছিক | <table> এর সন্তান। টেবিলে অন্তর্ভুক্ত একটি কলাম সম্পর্কে তথ্য। নিম্নলিখিত বৈশিষ্ট্যগুলি অন্তর্ভুক্ত করে:
|
<data> | ঐচ্ছিক | <table> এর সন্তান। টেবিল দ্বারা উল্লেখ করা ডেটা ফাইল। যদি ফাইলের নামটি URL আকারে হয় (যেমন, http://... ), তাহলে ফাইলটি উপযুক্ত প্রোটোকলের (HTTP, HTTPS, বা FTP) মাধ্যমে আনা হবে; অন্যথায়, এই নামের একটি ফাইল অবশ্যই ডেটাসেটের সাথে বান্ডিল করতে হবে। প্রয়োজনীয় বৈশিষ্ট্য format মান সর্বদা csv হয়। যদিও encoding বৈশিষ্ট্য ঐচ্ছিক, আপনার .csv ফাইলগুলি অবশ্যই UTF-8 এনকোডেড হতে হবে৷ |
বিষয়
বর্ণনা
বিষয়গুলি ধারণাগুলিকে শ্রেণিবদ্ধভাবে শ্রেণিবদ্ধ করে, ব্যবহারকারীদের আপনার ডেটাসেটের মাধ্যমে আরও সহজে নেভিগেট করতে দেয়।
আপনার DSPL ফাইলের <concepts> উপাদানের ঠিক আগে <topics> উপাদানটি উপস্থিত হওয়া উচিত। (উপাদানের ক্রম গুরুত্বপূর্ণ, এবং যদি আপনার উপাদানগুলি ভুল ক্রমে প্রদর্শিত হয় তবে আপনি আপনার ডেটাসেট আপলোড করতে সক্ষম হবেন না।) বিষয়গুলি ব্যবহার করতে, ধারণার সংজ্ঞা থেকে তাদের উল্লেখ করুন।
উদাহরণ
এখানে একটি উদাহরণ বিষয় সংজ্ঞা:
<topics>
<topic id="population_indicators">
<info>
<name>
<value>Population indicators</value>
</name>
</info>
</topic>
...
</topics>
...এবং এখানে একটি ধারণা থেকে এই বিষয়টির একটি উদাহরণ উল্লেখ রয়েছে:
<concept id="population"> <info> <name> <value>Population</value> </name> <description> <value>Size of the resident population.</value> </description> <topic ref="population_indicators"/> <type ref="integer"/> </concept>
বিষয়গুলি নেস্ট করা যেতে পারে, এবং একটি ধারণা একাধিক বিষয় উল্লেখ করতে পারে।
উপাদান সংজ্ঞা
| উপাদান | প্রয়োজন? | বর্ণনা |
|---|---|---|
<topics> | হ্যাঁ | শীর্ষ-স্তরের উপাদান। সমস্ত <topic> উপাদানগুলিকে আবদ্ধ করে। |
<topic> | হ্যাঁ | বিষয় চিহ্নিত করে। প্রয়োজনীয় অ্যাট্রিবিউট id মান অবশ্যই ডেটাসেটের জন্য অনন্য হতে হবে। |
<info> | ঐচ্ছিক | <topic> এর সন্তান। একটি বিষয় সম্পর্কে তথ্য সংযুক্ত করে। |
<name> | ঐচ্ছিক | <info> এর সন্তান। এর চাইল্ড এলিমেন্ট <value> বিষয়ের নাম নির্দিষ্ট করে। |
DSPL ডেটা ফাইল
XML মেটাডেটা ফাইল ছাড়াও, একটি DSPL ডেটাসেট CSV ফর্ম্যাটে এক বা একাধিক ডেটা ফাইলও অন্তর্ভুক্ত করতে পারে। প্রতিটি ডেটা ফাইল ডেটাসেটের একটি টেবিলকে সমর্থন করে এবং এটির <data>...</data> বিভাগে পূর্বের থেকে উল্লেখ করা হয়। ধারণাগতভাবে, এই ফাইলগুলি এবং তাদের সম্পর্কিত টেবিলগুলি ধারণার সংজ্ঞা বা স্লাইস ডেটা উপস্থাপন করতে ব্যবহৃত হয়। এই ডেটা ফাইলের ধরনগুলির প্রত্যেকটি নীচে আরও বিশদে বর্ণনা করা হয়েছে।
লক্ষ্য করুন যে, উদ্দেশ্য নির্বিশেষে, সমস্ত ডেটা ফাইল অবশ্যই কমা-ডিলিমিটেড (CSV) UTF-8 টেক্সট ফাইল হতে হবে। ফাইলগুলিতে শুধুমাত্র প্লেইন টেক্সট থাকতে হবে; HTML নেই। আপনি ম্যানুয়ালি ডেটা ফাইলগুলি তৈরি করতে পারেন, কিন্তু বাস্তবিকভাবে আপনাকে মূল ডেটা উৎস (যেমন, একটি স্প্রেডশীট) বা রপ্তানি করা ফাইলে থাকা টুলে ডেটা ম্যাসেজ করতে হবে।
ফাইলগুলিকে ডেটাসেটের সাথে বান্ডিল করা যেতে পারে বা, যদি নামটি URL আকারে হয়, তাহলে HTTP, HTTPS বা দূরবর্তী উত্স থেকে FTP এর মাধ্যমে আনা হয়৷
ধারণা ডেটা ফাইল
কনসেপ্ট ডেটা ফাইলে প্রতিটি কনসেপ্টের জন্য প্রাসঙ্গিক তথ্য থাকে। ধারণা সংজ্ঞা এই ফাইলটি উল্লেখ করার জন্য <table> উপাদান ব্যবহার করে।
উদাহরণ
উপরে সংজ্ঞায়িত country ধারণার জন্য একটি টেবিলের উদাহরণ এখানে দেওয়া হল:
country, name AD, Andorra AF, Afghanistan AI, Anguilla AL, Albania AO, Angola AQ, Antarctica AS, American Samoa
এই উদাহরণটি কীভাবে কাজ করে তা এখানে:
- ম্যাপিং নির্দিষ্ট করা না থাকলে, ডেটা ফাইলের প্রথম লাইন (কলাম শিরোনাম) অবশ্যই কনসেপ্ট আইডি এবং ধারণার উপযুক্ত প্রপার্টি আইডির সাথে মিল থাকতে হবে যার সাথে ডেটা যুক্ত। যাইহোক, ডেটা ফাইল এবং ধারণা টেবিলে কলামের ক্রম একই হতে হবে না। এই ক্ষেত্রে, প্রথম কলামটি ধারণা
countryসাথে যুক্ত, এবং দ্বিতীয় কলামটি সম্পত্তিnameসাথে যুক্ত। - সম্পত্তি কলাম ঐচ্ছিক; যদি একটি সম্পত্তির টেবিলে একটি কলাম না থাকে, তাহলে প্রতিটি সারির জন্য এর মান অনির্ধারিত বলে ধরে নেওয়া হয়। উপরের টেবিলটি, উদাহরণস্বরূপ,
latitudeএবংlongitudeবৈশিষ্ট্যগুলির জন্য কলামগুলি বাদ দেয়, তাই দেশগুলি ম্যাপযোগ্য হবে না৷ - ধারণার আইডি ক্ষেত্রের প্রতিটি মান (এই ক্ষেত্রে,
country) অবশ্যই অনন্য এবং অ-খালি হতে হবে (একটি খালি ক্ষেত্র শূন্য বা শুধুমাত্র হোয়াইটস্পেস অক্ষর সহ একটি)। - বৈশিষ্ট্যের মানগুলি যেগুলি অন্যান্য ধারণার উল্লেখ করে সেগুলি অবশ্যই খালি হতে হবে বা উল্লেখিত ধারণার একটি বৈধ মান হতে হবে৷
- দ্বৈত উদ্ধৃতিগুলির মধ্যে মানগুলিকে সংযুক্ত করা ঐচ্ছিক, যখন সেগুলিতে কমা, দ্বিগুণ উদ্ধৃতি, বা নতুন লাইন অক্ষর থাকে৷
- একটি আক্ষরিক দ্বিগুণ উদ্ধৃতি থেকে এড়িয়ে যান যা একটি মানের সাথে অন্য একটি দ্বিগুণ উদ্ধৃতি দিয়ে পূর্বে প্রদর্শিত হয়৷
স্লাইস ডেটা ফাইল
স্লাইস ডেটা ফাইলগুলিতে প্রতিটি স্লাইসের জন্য প্রাসঙ্গিক ডেটা থাকে। স্লাইস সংজ্ঞা <table ref="..."> উপাদান ব্যবহার করে <table> সংজ্ঞা উল্লেখ করতে, যা এই ফাইলটিকে চিহ্নিত করে।
উদাহরণ
উপরে বর্ণিত population_by_country স্লাইসের জন্য ডেটা ধারণকারী একটি .csv ফাইলের উদাহরণ এখানে দেওয়া হল:
country, year, population AF, 1960, 9616353 AF, 1961, 9799379 AF, 1962, 9989846 AF, 1963, 10188299
উদাহরণটি কীভাবে কাজ করে তা এখানে:
- মেট্রিক ক্ষেত্র হল
population। ক্ষেত্রcountryএবংyearমাত্রা ক্ষেত্র. - একটি মাত্রা ক্ষেত্রের প্রতিটি মান খালি হতে হবে। এই সময়ের মাত্রা অন্তর্ভুক্ত. মেট্রিক ক্ষেত্রের মান খালি হতে পারে। একটি খালি মান কোন অক্ষর দ্বারা প্রতিনিধিত্ব করা হয়.
- প্রতিটি কলামের শিরোনাম যা একটি ধারণার উল্লেখ করে (উদাহরণস্বরূপ, উপরের উদাহরণের প্রথম ক্ষেত্রটি ধারণার
countryউল্লেখ করে) ধারণার সংজ্ঞায় ধারণার অনন্য আইডির সাথে হুবহু মেলে। - মাত্রা মানগুলির একটি অনন্য সমন্বয়, যেমন
AF, 2000, শুধুমাত্র একবার ঘটতে পারে। - একই সময়ের সিরিজের সারিগুলি (অর্থাৎ, সময় ব্যতীত সমস্ত মাত্রার মানগুলির একই সংমিশ্রণ রয়েছে এমন সারিগুলিকে অবশ্যই একসাথে গোষ্ঠীবদ্ধ করতে হবে, যদিও সেগুলিকে অন্যভাবে সাজানোর দরকার নেই৷
উন্নত বৈশিষ্ট্য
বহু-ভাষা ডেটাসেট
অনুবাদিত XML মান
আপনি আপনার DSPL ফাইলের প্রতিটি <value> উপাদানের সাথে xml:lang অ্যাট্রিবিউট ব্যবহার করতে পারেন। এই বৈশিষ্ট্যটি মানক, W3C ভাষা ট্যাগ ব্যবহার করে উপাদানের বিষয়বস্তুর ভাষা নির্দিষ্ট করে। উল্লেখ্য যে এই বৈশিষ্ট্যটির ব্যবহার ঐচ্ছিক; যদি কোনো xml:lang বৈশিষ্ট্য অন্তর্ভুক্ত না হয়, তাহলে বিষয়বস্তু ইংরেজিতে বলে ধরে নেওয়া হয়।
নিম্নলিখিত উদাহরণটি ইংরেজি, বুলগেরিয়ান, কাতালান এবং সরলীকৃত চীনা ভাষায় একটি ডেটাসেটের স্নিপেট দেখায়:
<dspl ...>
<info>
<name>
<value xml:lang="en">World Bank, World Development Indicators</value>
<value xml:lang="bg">Световна банка, Индикатори за световно развитие</value>
<value xml:lang="ca">Banc Mundial, Indicadors del desenvolupament mundial</value>
<value xml:lang="zh-CN">国家/地区</value>
</name>
...
</info>
<concepts>
<concept id="country">
<info>
<name>
<value xml:lang="en">Country</value>
<value xml:lang="bg">Страна</value>
<value xml:lang="ca">País</value>
<value xml:lang="zh-CN">国家/地区</value>
</name>
...
</info>
...
</concept>
...
</concepts>
...
</dspl>অনুবাদিত বৈশিষ্ট্য
কিছু ক্ষেত্রে, আপনি এমন অনুবাদগুলি প্রদান করতে চাইতে পারেন যা ধারণা-স্তরের মেটাডেটা অতিক্রম করে, পৃথক ধারণার দৃষ্টান্তগুলিতে অতিরিক্ত (বা পরিবর্তে) প্রয়োগ করে। এটি বিশেষভাবে কার্যকর যখন একটি ধারণা সম্পত্তির মান (যেমন, নাম) ভাষা অনুসারে পরিবর্তিত হয়।
একাধিক ভাষায় এই ধরনের মান প্রদান করতে, প্রতিটি সম্পত্তি/ভাষার সমন্বয়ের জন্য সংশ্লিষ্ট সংজ্ঞা সারণীতে একটি কলাম তৈরি করুন। তারপর, টেবিল রেফারেন্স ট্যাগে <mapProperty xml:lang="..." ref="..." toColumn="..."> উপাদানগুলির একটি সেট যোগ করে এই কলামগুলিকে তাদের সম্পর্কিত বৈশিষ্ট্য এবং ভাষার সাথে লিঙ্ক করুন ধারণা
এখানে একটি উদাহরণ রয়েছে যা ইংরেজি, স্প্যানিশ এবং ফরাসি ভাষায় নাম সহ একটি দেশের ধারণাকে সংজ্ঞায়িত করে:
<concepts> ... <concept id="country" extends="geo:location"> ... <property id="name"> <info> <name> <value>Name</value> </name> <description> <value>The official name of the country</value> </description> </info> <type ref="string" /> </property> ... <table ref="countries_table"> <mapProperty xml:lang="en" ref="name" toColumn="name_en"/> <mapProperty xml:lang="es" ref="name" toColumn="name_es"/> <mapProperty xml:lang="fr" ref="name" toColumn="name_fr"/> </table> </concept> ... </concepts> ... <tables> ... <table id="countries_table"> <column id="country" type="string"/> <column id="name_en" type="string"/> <column id="name_es" type="string"/> <column id="name_fr" type="string"/> ... </table> </tables>
তারপর countries_table জন্য CSV ফাইলের নিম্নলিখিত ফর্ম থাকবে:
country,name_en,name_es,name_fr,... ... US,United States of America,Estados Unidos de América,États-Unis d'Amérique,... ...
ম্যাপযোগ্য ধারণা
অনেক ধারণার (উদাহরণস্বরূপ: কাউন্টি, রাজ্য এবং শহর) ভৌগলিক অবস্থানের সাথে সম্পর্কিত উদাহরণ রয়েছে। DSPL এই দৃষ্টান্তগুলিকে জিওকোডিং সমর্থন করে যাতে সেগুলি Google পাবলিক ডেটা অ্যানিমেটেড মানচিত্র চার্টে দৃশ্যমান হবে৷
যদি আপনার ধারণাটি বিশ্বের দেশ, মার্কিন রাজ্য বা মার্কিন কাউন্টির সমতুল্য হয়, তাহলে আপনি শুধুমাত্র সংশ্লিষ্ট Google ক্যানোনিকাল ধারণার সাথে লিঙ্ক করতে পারেন; কোন স্পষ্ট জিওকোডিং প্রয়োজন নেই. আরও বিস্তারিত জানার জন্য ক্যানোনিকাল ধারণার গাইড দেখুন।
যদি না হয়, তাহলে আপনাকে আপনার ধারণাকে ম্যাপযোগ্য করতে হবে। প্রথম ধাপ হল এটিকে geo:location থেকে প্রসারিত করা:
<concept id="..." extends="geo:location"> ... </concept>
তারপরে, আপনাকে অবশ্যই বৈশিষ্ট্য হিসাবে স্পষ্টভাবে অক্ষাংশ এবং দ্রাঘিমাংশ যোগ করতে হবে:
<concept id="..." extends="geo:location"> ... <property id="latitude"/> <property id="longitude"/> </concept>
এর জন্য মানগুলি তারপরে সংশ্লিষ্ট ধারণা সংজ্ঞা ডেটা টেবিলে কলাম হিসাবে নির্দিষ্ট করা হয়।
ধারণা সম্পর্ক
ধারণাগুলি প্রায়শই কাঠামোগত উপায়ে অন্যান্য ধারণাগুলির সাথে সম্পর্কিত। উদাহরণস্বরূপ, একটি মহাদেশের উদাহরণে একাধিক দেশের দৃষ্টান্ত অন্তর্ভুক্ত থাকতে পারে, যার ফলে, একাধিক রাজ্য বা প্রদেশের উদাহরণ থাকতে পারে। ডেটাসেট মেটাডেটাতে এই সম্পর্কগুলিকে এনকোড করা অন্যথায় সম্ভব হওয়ার চেয়ে সমৃদ্ধ ভিজ্যুয়ালাইজেশন বৈশিষ্ট্যগুলির জন্য মঞ্জুরি দেয়, যেমন, বেছে নেওয়ার জন্য অবস্থানগুলির একটি সংকীর্ণ গাছ দেখানো।
নীচের বিভাগে, আমরা DSPL স্কিমা সমর্থিত ধারণা সম্পর্ক বর্ণনা করি।
শ্রেণিবিন্যাস
শিশু ধারণার একটি <property> ট্যাগে একটি isParent="true" অ্যাট্রিবিউট ব্যবহারের মাধ্যমে DSPL-এ ধারণার শ্রেণিবিন্যাস উপস্থাপন করা হয়, যেটিতে পিতামাতার ধারণা থেকে দৃষ্টান্তের শনাক্তকারী রয়েছে।
উদাহরণ হিসেবে, গুগলের ইউএস কাউন্টি ধারণার নিম্নলিখিত রূপ রয়েছে:
<concept id="us_county" extends="geo:location">
<info>
<name>
<value xml:lang="en">County</value>
</name>
...
</info>
...
<property id="state" concept="us_state" isParent="true"/>
...
<data>
<table ref="reference_us_counties"/>
</data>
</concept>
সমর্থনকারী ডেটা টেবিলে প্রতিটি কাউন্টির জন্য দুই-অক্ষরের রাজ্য কোড সহ একটি state কলাম রয়েছে। এই ধরনের মেটাডেটা পাবলিক ডেটা এক্সপ্লোরারকে রাজ্য এবং কাউন্টিগুলিকে একটি শ্রেণিবিন্যাস হিসাবে দেখানোর অনুমতি দেয়, এমন একটি বৈশিষ্ট্য যা ব্যবহারকারীদের জন্য অনুসন্ধানকে আরও সহজ করে তোলে।
মনে রাখবেন যে একটি ধারণার অনেক সন্তান থাকতে পারে কিন্তু একজনের বেশি পিতামাতা নয় ।
ম্যাপিং
কনসেপ্ট ম্যাপিং (অর্থাৎ, ধারণা যা প্রতিনিধিত্ব করে, মৌলিকভাবে, একই জিনিস) ম্যাপ করা ধারণার একটি property ট্যাগে একটি isMapping="true" অ্যাট্রিবিউটের মাধ্যমে উপস্থাপন করা হয়।
নির্দিষ্ট করা যে একটি ধারণা অন্যটির সাথে মানচিত্রটি পূর্ববর্তীটিকে পরবর্তীটির সমস্ত বৈশিষ্ট্য এবং বৈশিষ্ট্যগুলি উত্তরাধিকারী হতে দেয়৷ অন্যান্য অ্যাপ্লিকেশনগুলির মধ্যে, এটি Google-এর ক্যানোনিকাল জিও ডেটাসেটে সংজ্ঞায়িত ব্যক্তিগত ভৌগলিক ধারণাগুলির সাথে "লিংক" করার জন্য দরকারী:
<concept id="my_country" extends="geo:location">
<info>
<name>
<value xml:lang="en">Country</value>
</name>
...
</info>
...
<property id="google_country_code" concept="geo:country" isMapping="true"/>
<data>
<table ref="countries_concept"/>
</data>
</concept>
এক্সটেনশন
কনসেপ্ট এক্সটেনশনগুলি সংশ্লিষ্ট কনসেপ্টের সংজ্ঞায় একটি extends উপাদানের মাধ্যমে মনোনীত করা হয়। এক্সটেনশনগুলি ইঙ্গিত করার জন্য দরকারী যে একটি নির্দিষ্ট ধারণা অন্য, বিস্তৃত ধারণার একটি উপশ্রেণী। বর্ধিত ধারণাটি তার পিতামাতার সমস্ত বৈশিষ্ট্য এবং বৈশিষ্ট্যগুলিকে উত্তরাধিকার সূত্রে পায় এবং অতিরিক্তগুলিও যোগ করতে পারে৷
উদাহরণ হিসেবে, Google-এর currency ধারণা unit প্রসারিত করে:
<concept id="unit">
...
</concept>
<concept id="currency" extends="unit">
<info>
<name>
<value xml:lang="en">Currency unit</value>
</name>
...
</info>
...
<table ref="currency_table"/>
</concept>
আরও ব্যাখ্যা এবং উদাহরণের জন্য টিউটোরিয়ালে কনসেপ্ট এক্সটেনশনের আলোচনা দেখুন।
আপনার ডেটাসেট জমা দেওয়া হচ্ছে
Google পাবলিক ডেটা এক্সপ্লোরারে আপনার ডেটাসেট জমা দিতে, এই নির্দেশাবলী অনুসরণ করুন:
- একটি ডিরেক্টরি তৈরি করুন।
- আপনার তৈরি করা ডিরেক্টরিতে ডেটাসেট ডিএসপিএল ফাইলটি সংরক্ষণ করুন। .xml এক্সটেনশন ব্যবহার করতে ভুলবেন না।
- একই ডিরেক্টরিতে স্থানীয় .csv ফাইল সংরক্ষণ করুন। ইউআরএলের মাধ্যমে উল্লেখ করা ডেটা ফাইল বাদ দেওয়া যেতে পারে।
- ডিরেক্টরি জিপ করুন।
- Google পাবলিক ডেটা এক্সপ্লোরারে আপনার ডেটাসেট আপলোড করুন ।
একবার আপনার ডেটাসেট আপলোড এবং যাচাই হয়ে গেলে, আপনার Google অ্যাকাউন্টে সাইন ইন করার সময় আপনি এটি পরীক্ষা করতে পারেন। আপনি এটি পরীক্ষা না করা পর্যন্ত এবং এটি প্রস্তুত বলে আমাদের না জানানো পর্যন্ত এটি প্রকাশ করা হবে না৷