বাস্তব জগতে এমএল সিস্টেম: সাহিত্য

এই পাঠে, আপনি 18 শতকের সাহিত্যের সাথে সম্পর্কিত একটি বাস্তব-বিশ্ব ML সমস্যা* ডিবাগ করবেন।

বাস্তব বিশ্বের উদাহরণ: 18 শতকের সাহিত্য

  • 18 শতকের সাহিত্যের অধ্যাপক শুধুমাত্র লেখকের ব্যবহৃত "মনের রূপকের" উপর ভিত্তি করে লেখকদের রাজনৈতিক সম্বন্ধ ভবিষ্যদ্বাণী করতে চেয়েছিলেন।
পুরাতন বই
  • 18 শতকের সাহিত্যের অধ্যাপক শুধুমাত্র লেখকের ব্যবহৃত "মনের রূপকের" উপর ভিত্তি করে লেখকদের রাজনৈতিক সম্বন্ধ ভবিষ্যদ্বাণী করতে চেয়েছিলেন।
  • গবেষকদের দল অনেক লেখকের কাজ, বাক্য দ্বারা বাক্য, এবং ট্রেন/বৈধতা/পরীক্ষা সেটে বিভক্ত করে একটি বড় লেবেলযুক্ত ডেটা সেট তৈরি করেছে।
পুরাতন বই
  • 18 শতকের সাহিত্যের অধ্যাপক শুধুমাত্র লেখকের ব্যবহৃত "মনের রূপকের" উপর ভিত্তি করে লেখকদের রাজনৈতিক সম্বন্ধ ভবিষ্যদ্বাণী করতে চেয়েছিলেন।
  • গবেষকদের দল অনেক লেখকের কাজ, বাক্য দ্বারা বাক্য, এবং ট্রেন/বৈধতা/পরীক্ষা সেটে বিভক্ত করে একটি বড় লেবেলযুক্ত ডেটা সেট তৈরি করেছে।
  • প্রশিক্ষিত মডেল পরীক্ষার ডেটাতে প্রায় নিখুঁতভাবে কাজ করেছে, কিন্তু গবেষকরা মনে করেছেন ফলাফলগুলি সন্দেহজনকভাবে সঠিক ছিল। কি ভুল হয়ে গেছে?
পুরাতন বই

কেন আপনি মনে করেন পরীক্ষার নির্ভুলতা সন্দেহজনকভাবে উচ্চ ছিল? আপনি সমস্যাটি বের করতে পারেন কিনা দেখুন, এবং তারপর আপনি সঠিক কিনা তা খুঁজে বের করতে নীচের প্লে বোতাম ▶ ক্লিক করুন৷

  • ডেটা স্প্লিট A: গবেষকরা প্রতিটি লেখকের কিছু উদাহরণ প্রশিক্ষণ সেটে, কিছু বৈধতা সেটে, কিছু পরীক্ষা সেটে রাখেন।
রিচার্ডসনের সমস্ত উদাহরণ প্রশিক্ষণ সেটে থাকতে পারে, যখন সুইফটের সমস্ত উদাহরণ বৈধকরণ সেটে থাকতে পারে।
প্রশিক্ষণ, বৈধতা, এবং পরীক্ষার সেটগুলিতে লেখক উদাহরণগুলির ভাঙ্গন দেখানো ডায়াগ্রাম। তিনজন লেখকের প্রত্যেকের উদাহরণ প্রতিটি সেটে উপস্থাপন করা হয়েছে।
  • ডেটা স্প্লিট বি: গবেষকরা প্রতিটি লেখকের সমস্ত উদাহরণ একটি একক সেটে রেখেছেন।
প্রশিক্ষণ, বৈধতা, এবং পরীক্ষার সেটগুলিতে লেখক উদাহরণগুলির ভাঙ্গন দেখানো ডায়াগ্রাম। প্রশিক্ষণ সেটে শুধুমাত্র সুইফটের উদাহরণ রয়েছে, যাচাইকরণ সেটে শুধুমাত্র ব্লেকের উদাহরণ রয়েছে এবং পরীক্ষার সেটে শুধুমাত্র ডিফো থেকে উদাহরণ রয়েছে।
  • ডেটা স্প্লিট A: গবেষকরা প্রতিটি লেখকের কিছু উদাহরণ প্রশিক্ষণ সেটে, কিছু বৈধতা সেটে, কিছু পরীক্ষা সেটে রাখেন।
  • ডেটা স্প্লিট বি: গবেষকরা প্রতিটি লেখকের সমস্ত উদাহরণ একটি একক সেটে রেখেছেন।
  • ফলাফল: ডেটা স্প্লিট A-তে প্রশিক্ষিত মডেলের ডেটা স্প্লিট বি-তে প্রশিক্ষিত মডেলের তুলনায় অনেক বেশি নির্ভুলতা ছিল।

নৈতিক: সাবধানে বিবেচনা করুন কিভাবে আপনি উদাহরণ বিভক্ত.

তথ্য প্রতিনিধিত্ব করে কি জানুন.

* আমরা এই মডিউলটি খুব ঢিলেঢালাভাবে (পথে কিছু পরিবর্তন করে) "মানুষের জন্য ডেটা মাইনিং-এ অর্থ ও খনির প্রভাব" এর উপর ভিত্তি করে তৈরি করেছি।