1. স্টেকহোল্ডারদের টাইপোলজি
আপনি আপনার ডেটাসেট-ডকুমেন্টেশন স্বচ্ছতার প্রচেষ্টা শুরু করার আগে এবং ডেটা কার্ড তৈরি করার আগে, এটি গুরুত্বপূর্ণ যে আপনি ডেটাসেট লাইফসাইকেল জুড়ে স্টেকহোল্ডারদের সনাক্ত করুন এবং আমন্ত্রণ জানান। এটি ডেটা কার্ডগুলি তৈরি করা সহজ করে তোলে কারণ এটি আপনাকে সমস্ত কিছু দিয়ে সজ্জিত করে যা আপনি সামগ্রী তৈরি করার সময় আপনাকে আরও শক্তিশালী বিবেচনা করতে হবে৷
একটি ডেটাসেটের জীবনচক্র প্রক্রিয়ায় ক্রস-ফাংশনাল স্টেকহোল্ডাররা কীভাবে জড়িত থাকে তা অন্বেষণ এবং বুঝতে আপনাকে সহায়তা করার জন্য, আমরা একটি টাইপোলজি তৈরি করেছি যা আপনাকে প্রায়শই পৃথক স্টেকহোল্ডারদের সম্পর্কে করা অনুমানগুলি খুঁজে বের করতে দেয়৷ আমাদের টাইপোলজি তিনটি স্টেকহোল্ডার গ্রুপে বিভক্ত যারা একটি ডেটাসেটের জীবনচক্রের সাথে জড়িত: প্রযোজক, এজেন্ট এবং ব্যবহারকারী।
এই টাইপোলজি ডেটাসেট এবং তাদের ডকুমেন্টেশন থেকে ক্রমাগত পরিবর্তনশীল চাহিদা এবং প্রত্যাশাগুলির একটি ধারাবাহিকতা উপস্থাপন করে। কোনো এক-আকার-ফিট-সমস্ত সমাধান নেই।
প্রযোজক
প্রযোজকরা ডেটাসেট এবং ডকুমেন্টেশনের স্রষ্টা এবং ডেটাসেট সংগ্রহ, মালিকানা, লঞ্চ এবং রক্ষণাবেক্ষণের জন্য দায়ী।
এর মূল অংশে, আপনি প্রযোজকদের ডেটাসেটগুলির উত্পাদন এবং প্রকাশনার জন্য দায়ী এবং লঞ্চ, গ্রহণ এবং/অথবা সাফল্যের জন্য দায়ী হিসাবে ভাবতে পারেন।
প্রযোজক ব্যক্তি বা গোষ্ঠীও হতে পারে যাদের ডেটা সংগ্রহ বা লেবেল করার জন্য নিয়োগ করা হয় এবং ডেটা জীবনচক্রের সময় বিভিন্ন পয়েন্টে পদ্ধতি বা ব্যাখ্যার বিষয়ে পরামর্শ প্রদান করা হয়।
প্রেক্ষাপটের উপর নির্ভর করে, প্রযোজকরা আপনার বর্তমান এবং ভবিষ্যত দলের সদস্য, অংশীদার, ক্লায়েন্ট বা ডেটা-হোস্টিং প্ল্যাটফর্মের প্রতিনিধিত্ব করতে পারে — সমস্ত ডেটাসেট রক্ষণাবেক্ষণ বা রক্ষণাবেক্ষণ, স্থাপনা এবং পর্যবেক্ষণের জন্য দায়ী।
এজেন্ট
এজেন্ট হল স্টেকহোল্ডার যারা আপনার ডেটাসেট ডকুমেন্টেশন বা ডেটা কার্ড এবং অন্যান্য মেশিন-লার্নিং (ML) মডেল-সম্পর্কিত ডকুমেন্টেশন পড়ে, এবং তারা বা অন্যরা কীভাবে বর্ণিত ডেটাসেট বা AI সিস্টেমগুলি ব্যবহার করতে পারে তা নির্ধারণ করার জন্য এজেন্সি রয়েছে।
তাদের ডোমেনের উপর নির্ভর করে, এজেন্টদের একটি অপারেশনাল বা পর্যালোচনাকারীর ভূমিকা থাকতে পারে, যেমন একটি একাডেমিক সেটিংয়ে একজন গবেষক যিনি ডেটাসেটের উপযুক্ত ব্যবহার পরিমাপ করতে চান বা একটি পণ্য দলের একজন ডেটা বিজ্ঞানী যিনি ডেটাসেটের সামগ্রিক ফিট নির্ধারণ করতে চান কারণ এটি পণ্য একীকরণের সাথে সম্পর্কিত।
এই পার্থক্যটি গুরুত্বপূর্ণ কারণ পর্যালোচকরা এমন স্টেকহোল্ডারদের অন্তর্ভুক্ত করে যারা সরাসরি ডেটাসেট ব্যবহার করতে পারে না, কিন্তু তবুও ডেটা কার্ডের সাথে জড়িত থাকে, যেমন শিল্প পরামর্শদাতা, অনুসন্ধানী সাংবাদিক, সম্প্রদায়ের প্রতিনিধি এবং আইনি সত্তা। সাধারণ ডেটাসেট ডকুমেন্টেশনে উপস্থাপিত তথ্য নেভিগেট করার জন্য এজেন্টদের প্রযুক্তিগত দক্ষতা থাকতে পারে বা নাও থাকতে পারে, কিন্তু প্রায়শই প্রয়োজন অনুযায়ী দক্ষতার অ্যাক্সেস থাকে।
ব্যবহারকারীদের
ব্যবহারকারীরা হলেন ব্যক্তি এবং প্রতিনিধি যারা পণ্যগুলির সাথে যোগাযোগ করে যা ডেটাসেটের উপর প্রশিক্ষিত মডেলগুলির উপর নির্ভর করে।
ব্যবহারকারীরা পণ্যের অভিজ্ঞতার অংশ হিসাবে তাদের ডেটা সরবরাহ করতে সম্মত হতে পারে, তবে তাদের সাধারণত ডেটাসেটের ক্ষেত্রেও পণ্যের অভিজ্ঞতার মধ্যে ভিত্তি করে একটি উল্লেখযোগ্যভাবে ভিন্ন ব্যাখ্যা এবং নিয়ন্ত্রণের প্রয়োজন হয়।
সারাংশ
নিম্নলিখিত সারণী স্টেকহোল্ডার গোষ্ঠীগুলিকে তাদের বর্ণনা, দায়িত্ব, উদাহরণ এবং সাধারণ কাজ দ্বারা সংক্ষিপ্ত করে:
স্টেকহোল্ডার গ্রুপ | বর্ণনা | দায়িত্ব | উদাহরণ | সাধারণ কাজ |
প্রযোজক | ডেটাসেট এবং/অথবা ডকুমেন্টেশন তৈরি করুন। | ডেটাসেট ডিজাইন, তৈরি, গুণমান পরীক্ষা, নথি, লঞ্চ, গ্রহণ, রক্ষণাবেক্ষণ এবং আপডেট করুন। | গবেষক, ডেটা সায়েন্টিস্ট এবং বিশ্লেষক, সফটওয়্যার ইঞ্জিনিয়ার এবং প্রোডাক্ট এবং প্রোগ্রাম ম্যানেজার | ডেটাসেট গ্রহণ, প্রকাশ, ভবিষ্যত-প্রুফিং, ন্যায্যতা এবং নিরাপত্তা, এবং উন্নতি |
এজেন্ট | তাদের কাজ, পণ্য, সংস্থা বা সম্প্রদায়ের জন্য ডেটাসেট মূল্যায়ন এবং ব্যবহার করুন। | ডেটা কার্ড ব্যবহার করুন, কিন্তু ডেটাসেটের সাথে ইন্টারঅ্যাক্ট নাও করতে পারে। | এমএল বা পণ্য প্রকৌশলী, গবেষক, তৃতীয় পক্ষের বিক্রেতা, বিষয়-বিষয় বিশেষজ্ঞ, শিল্প, পরামর্শদাতা, নীতি বিশেষজ্ঞ, ডেটা পরিষেবা প্রদানকারী এবং নেতৃত্ব বা ব্যবস্থাপনা | জটিলতা পরিচালনা করুন, জবাবদিহি করুন, ট্রেড-অফ করুন, উৎপাদনে স্থাপন করুন, সংরক্ষণাগার করুন |
ব্যবহারকারীদের | প্রযোজকের ডেটাসেট ব্যবহার করে এমন এজেন্টদের দ্বারা তৈরি পণ্য, ডিভাইস এবং অ্যাপগুলির সাথে ইন্টারঅ্যাক্ট করুন। | সম্ভবত পণ্যগুলির মাধ্যমে তাদের ডেটা অবদান রাখুন এবং প্রযোজক এবং এজেন্টদের জন্য সহায়ক সংকেত প্রদান করুন। | ডেটা অবদানকারী, পণ্য ব্যবহারকারী এবং ব্যবহারকারীদের প্রতিনিধি | পণ্য ব্যবহার করুন, ডেটা এবং গোপনীয়তা বুঝুন, প্রতিক্রিয়া প্রদান করুন এবং উদ্বেগ প্রকাশ করুন |
2. আপনার স্টেকহোল্ডারদের ম্যাপ করুন
এখন যেহেতু আপনি আমাদের টাইপোলজির সাথে কিছুটা পরিচিতি পেয়েছেন, আপনি এই মৌলিক ম্যাপিং কার্যকলাপের মাধ্যমে আপনার স্টেকহোল্ডারদের সনাক্ত করতে আপনার ডেটাসেটের জীবনচক্র পর্যালোচনা করতে পারেন৷ আপনি কার্যকলাপের মধ্য দিয়ে যাওয়ার সময়, কে ডেটাসেট বা এর ডকুমেন্টেশনের সাথে ইন্টারঅ্যাক্ট করতে পারে তা নোট করুন। এছাড়াও, স্টেকহোল্ডাররা ডেটা কার্ডগুলিতে কীভাবে অবদান রাখতে পারে তা বিবেচনা করুন।
আপনার স্টেকহোল্ডারদের ম্যাপ করতে, এই পদক্ষেপগুলি অনুসরণ করুন:
- প্রযোজকদের তালিকা করুন যারা ডেটা কার্ড তৈরি করবে ।
- এজেন্টদের তালিকা করুন যারা ডেটা কার্ড পড়বে এবং ব্যবহার করবে ।
- ব্যবহারকারীদের তালিকা করুন যারা ডেটা কার্ডে বর্ণিত ডেটাসেট ব্যবহার করবে বা প্রভাবিত হবে ।
- আপনার স্টেকহোল্ডারদের একটি মানচিত্র, ডেটা কার্ড তৈরিতে তাদের ভূমিকা এবং তাদের ডেটা কার্ডের উদ্দেশ্য তৈরি করতে নিম্নলিখিত টেমপ্লেটটি ব্যবহার করুন। এই মানচিত্রটি আপনাকে ডেটাসেট ডকুমেন্টেশনের ডাউনস্ট্রিম প্রয়োজনীয়তার জন্য একটি অন্তর্দৃষ্টি দেয় এবং ডেটাসেট-ডকুমেন্টেশন প্রক্রিয়া জুড়ে অগ্রাধিকার এবং দায়িত্ব বরাদ্দ করার ক্ষমতা দেয়।
3. এজেন্ট তথ্য ভ্রমণ (AIJs)
আপনার স্টেকহোল্ডারদের ম্যাপ আউট করার মাধ্যমে, আপনি নির্ধারণ করতে পারেন এজেন্টদের কাছে কী কী জানাতে হবে—আপনার প্রাথমিক স্টেকহোল্ডারদের—আপনার ডেটা কার্ডে যাতে আপনি তাদের সাফল্যের জন্য সেট আপ করতে পারেন৷
সাধারণত, প্রযুক্তির সাথে ইন্টারঅ্যাক্ট করার সময় একজন ব্যক্তির যে অভিজ্ঞতা হয় তাকে ব্যবহারকারীর যাত্রা বলা হয়। যাইহোক, আমরা এমন একজন এজেন্টের কথা বলছি যাকে একটি জ্ঞাত সিদ্ধান্ত নেওয়ার জন্য একটি ডেটাসেট সম্পর্কে যথেষ্ট তথ্য অর্জন করতে হবে, তাই আমরা এই অভিজ্ঞতাগুলিকে এজেন্ট তথ্য যাত্রা (AIJ) বলি৷
একটি AIJ এর লক্ষ্য হল নিম্নলিখিতগুলি বোঝা:
- যে কাজের জন্য এজেন্ট একটি ডেটাসেট চাইতে পারে।
- এজেন্টদের তাদের কাজগুলি সম্পূর্ণ করার জন্য প্রয়োজনীয় তথ্য।
- যে প্রক্রিয়ার মাধ্যমে এজেন্ট তথ্য বের করে।
AIJ এর মধ্যে নিম্নলিখিতগুলি অন্তর্ভুক্ত রয়েছে:
উদাহরণ
উদাহরণস্বরূপ, ধরুন আপনার একজন এজেন্ট একজন ডেটা সায়েন্টিস্ট। একটি তথ্য বিজ্ঞানীর জন্য একটি AIJ নিম্নলিখিত মত দেখতে পারে:
একজন তথ্য বিজ্ঞানী হিসাবে, আমি ডেটাসেটের গঠন জানতে চাই, তাই আমি জিজ্ঞাসা করি...
... ডেটা ফরম্যাট কি?
... ডেটাসেটের মোডালিটি কী?
... ডেটাসেটে কয়টি বৈশিষ্ট্য রয়েছে?
... কয়টি বৈশিষ্ট্য প্রকৌশলী?
... কোন বৈশিষ্ট্যগুলি দৃঢ়ভাবে সম্পর্কযুক্ত?
... যদি কাঠামোর মধ্যে কোন নির্ভরতা থাকে?
এখানে এমন একজন এজেন্টের জন্য আরেকটি উদাহরণ রয়েছে যিনি পণ্য নীতিতে কাজ করতে পারেন এবং একটি পণ্যের উৎপাদন ও উন্নয়ন সম্পর্কিত নির্দেশিকা সেট করেন:
নীতি সহায়ক হিসাবে, আমি জানতে চাই কিভাবে ডেটা অপব্যবহার হতে পারে , তাই আমি জিজ্ঞাসা করি...
... ডেটাসেটের উদ্দেশ্য কী ব্যবহার ছিল?
... কোন অ্যাপ্লিকেশন ডেটাসেট তৈরির অনুরোধ করেছিল?
... ডেটাসেটের বিপজ্জনক বা ঝুঁকিপূর্ণ অ্যাপ্লিকেশনগুলি কী পরিচিত?
... নির্দিষ্ট গ্রুপ ঝুঁকি কি?
... কিভাবে এই ডেটাসেটের উদ্দেশ্যমূলক ব্যবহার নির্বাচনী এলাকায় প্রভাব ফেলে?
... কিভাবে একটি আশ্রয়ের জন্য জিজ্ঞাসা করতে পারেন?
4. আপনার AIJ লিখুন
- নিম্নলিখিত প্রম্পটের উপর ভিত্তি করে কয়েকটি AIJ লিখুন:
- লক্ষ্য করুন যে আপনি কীভাবে কেবল আপনার স্টেকহোল্ডারদেরই মনে রাখেন না, তবে কিছু প্রাথমিক প্রশ্নও যা আপনি মনে করেন যে তারা আপনার ডেটা কার্ড পড়ে উত্তর দিতে চায়। এর মানে হল যে আপনি প্রশ্নগুলির চূড়ান্ত সেটের এক ধাপ কাছাকাছি যা আপনার ডেটা কার্ডে অন্তর্ভুক্ত করা উচিত।
5. অপটিক্স
আপনি হয়ত দৃষ্টিকোণ , লেন্স , এবং AIJ ফ্রেম করার সুযোগ শব্দগুলির ব্যবহার লক্ষ্য করেছেন৷ যদিও এই পদগুলি আগে সংজ্ঞায়িত করা হয়েছিল, তারা আসলে একটি নির্দেশক রূপকের অংশ যাকে আমরা অপটিক্স বলি। আপনার এজেন্টরা কীভাবে আপনার ডেটাসেট বুঝতে পারে সে সম্পর্কে আপনাকে ভাবতে সাহায্য করার জন্য আমরা সেগুলি তৈরি করেছি।
স্কোপ
অপটিক্সে, স্কোপগুলি স্পট, পর্যবেক্ষণ, ম্যাগনিফাই, প্রতিফলিত এবং এমনকি উপকরণ পরীক্ষা করার জন্য লেন্স এবং আয়না ব্যবহার করে। ডেটাসেটের পরিপ্রেক্ষিতে, এটি একটি দুর্দান্ত রূপক কারণ আপনি স্পষ্ট, অ-স্পষ্ট, দৃশ্যমান এবং অদৃশ্য দিকগুলি প্রকাশ করতে ফোকাস করেন এবং প্রশ্নগুলি ফ্রেম করেন৷
আমরা এটিকে স্কোপ হিসাবে উল্লেখ করি, এমন একটি মাধ্যম যার মাধ্যমে ডেটাসেটগুলির বোধগম্য করার জন্য ধারাবাহিকভাবে একাধিক প্রশ্ন জিজ্ঞাসা করা যায়। বিভিন্ন গ্র্যানুলারিটির স্কোপ স্ট্যাকিং করে, আপনি এমন সামগ্রী তৈরি করতে পারেন যা আপনার এজেন্টদের স্বচ্ছতা প্রতিবেদনের মাধ্যমে ডেটাসেটের সমন্বিত বোঝার জন্য সাহায্য করে।
নিম্নলিখিত সারণীতে আমাদের ফ্রেমওয়ার্কের তিন ধরনের স্কোপ রয়েছে, একটি বর্ণনা, একটি উদাহরণ এবং প্রতিটির উদ্দেশ্য সহ:
ব্যাপ্তি | বর্ণনা | উদাহরণ | উদ্দেশ্য |
টেলিস্কোপিক | গুণাবলী সম্পর্কে প্রশ্ন সাধারণত একাধিক ডেটাসেট জুড়ে পাওয়া যায় । তারা বৈশিষ্ট্য ট্যাগ. | এই ডেটাসেটে কি ব্যক্তিগত শনাক্তযোগ্য তথ্য (PII) আছে? | পরিচয় করিয়ে দিন এবং অতিরিক্ত তথ্যের জন্য প্রসঙ্গ সেট করুন যা আপনার এজেন্টদের আপনার ডেটা কার্ড বা স্বচ্ছতা আর্টিফ্যাক্ট নেভিগেট করতে সহায়তা করে। |
পেরিস্কোপিক | প্রযোজকের ডেটাসেটের জন্য নির্দিষ্ট বৈশিষ্ট্য সম্পর্কে প্রশ্ন। তারা পর্যবেক্ষণ বর্ণনা করে। | কয়টি বৈশিষ্ট্য PII ধারণ করে? | সাধারণত ডেটাসেটের আকার এবং আকার, বা উত্স বা উদ্দেশ্যগুলির মতো কার্যকরী তথ্যের মতো অপারেশনাল তথ্যের বিধানের জন্য সংরক্ষিত। |
মাইক্রোস্কোপিক | সিদ্ধান্ত, প্রক্রিয়া এবং প্রভাবগুলির মতো ডেটাসেটের অদৃশ্য দিকগুলি সম্পর্কে প্রশ্ন। তারা ব্যাখ্যা দাবি করে। | এই ডেটাসেটে PII কীভাবে বেনামী করা হয়েছিল? | সিদ্ধান্তের বিশদ ব্যাখ্যা প্রকাশ করুন বা সংশ্লিষ্ট পেরিস্কোপিক এবং টেলিস্কোপিক প্রশ্নগুলির প্রতিক্রিয়াগুলি পরিচালনা করে এমন দীর্ঘ প্রক্রিয়া নথিগুলির সংক্ষিপ্তসার করুন। |
আপনার ডেটা কার্ড তৈরির প্রক্রিয়া জুড়ে আপনার এই তিন ধরনের সুযোগ বিবেচনা করা গুরুত্বপূর্ণ। শুধুমাত্র টেলিস্কোপ সহ একটি ডেটা কার্ড শুধুমাত্র আপনার ডেটাসেট সম্পর্কে সুস্পষ্ট তথ্য বর্ণনা করে এবং কোনো স্বতন্ত্র মান যোগ করে না। শুধুমাত্র পেরিস্কোপ সহ একটি ডেটা কার্ড প্রসঙ্গ, প্রাসঙ্গিকতা বা গুরুত্ব সম্পর্কে কোনও বিবরণ ছাড়াই অতিরিক্ত প্রযুক্তিগত পেতে পারে। শুধুমাত্র অণুবীক্ষণ যন্ত্র সহ একটি ডেটা কার্ড এজেন্টদের বিশদ বিবরণে সহজেই হারিয়ে যেতে পারে এবং বড় ছবি দেখতে হারাতে পারে।
এই কারণেই আমরা দেখতে পাই যে ডেটা কার্ডের ব্যাখ্যাগুলি এই স্তরগুলির সুযোগগুলির উপস্থিতি বা অনুপস্থিতি দ্বারা ব্যাপকভাবে প্রভাবিত হয়। এই প্রশ্নগুলি এজেন্ট এবং প্রযোজকদের ঝুঁকি মূল্যায়ন করতে দেয়, প্রশমনের পরিকল্পনা করতে এবং, যেখানে প্রাসঙ্গিক, আরও ভাল ডেটাসেট তৈরির সুযোগগুলি সনাক্ত করতে দেয়। একসাথে, টেলিস্কোপ, পেরিস্কোপ এবং মাইক্রোস্কোপগুলি দরকারী বিশদ প্রদান করে যাতে অসংখ্য স্টেকহোল্ডার বিভ্রান্ত না হয়ে এবং হারিয়ে না গিয়ে আপনার ডেটা কার্ড নেভিগেট করতে পারে।
উদাহরণ
এজেন্ট তথ্য ভ্রমণ (AIJs) বিভাগে, আপনি AIJ-এর কিছু উদাহরণ দেখেছেন, যার মধ্যে একটি ডেটা সায়েন্টিস্টের জন্য রয়েছে। আপনি যদি সেই উদাহরণটি ঘনিষ্ঠভাবে দেখেন তবে আপনি দেখতে পাবেন যে আপনি নিম্নলিখিত প্রশ্নগুলি সহ স্কোপের ভিত্তিতে এই প্রশ্নগুলির কয়েকটিকে গোষ্ঠীবদ্ধ করতে পারেন:
একজন ডেটা সায়েন্টিস্ট হিসাবে, আমি ডেটাসেটের গঠন জানতে চাই, তাই আমি জিজ্ঞাসা করি...
টেলিস্কোপিক
... ডেটা ফরম্যাট কি?
... ডেটাসেটের মোডালিটি কী?
পেরিস্কোপিক
... ডেটাসেটে কয়টি বৈশিষ্ট্য রয়েছে?
... কয়টি বৈশিষ্ট্য প্রকৌশলী?
মাইক্রোস্কোপিক
... কোন বৈশিষ্ট্যগুলি দৃঢ়ভাবে সম্পর্কযুক্ত?
... যদি কাঠামোর মধ্যে কোন নির্ভরতা থাকে?
এটা খুব সম্ভবত যে আপনি ইতিমধ্যেই আপনার এজেন্টদের মাথায় রেখে কিছু টেলিস্কোপিক, পেরিস্কোপিক এবং মাইক্রোস্কোপিক প্রশ্ন নিয়ে এসেছেন।
6. সুযোগ সহ আপনার AIJs পুনর্গঠন
- স্কোপের সাথে আপনার AIJs পুনর্গঠন করতে, নিম্নলিখিত নমুনা প্রম্পট ব্যবহার করুন:
7. অভিনন্দন
অভিনন্দন! আপনি একটি ডেটা কার্ড তৈরি করতে শুরু করেন। এখন আপনি আপনার প্রশ্ন মূল্যায়ন করতে প্রস্তুত.