নীচের বিকল্পগুলি অন্বেষণ করুন.

একটি শ্রেণিবিন্যাস মডেল বিবেচনা করুন যা ইমেলকে দুটি বিভাগে বিভক্ত করে: "স্প্যাম" বা "স্প্যাম নয়।" আপনি যদি শ্রেণীবিভাগের থ্রেশহোল্ড বাড়ান, তাহলে নির্ভুলতার কী হবে?
অবশ্যই বাড়াবে।
শ্রেণিবিন্যাস থ্রেশহোল্ড বাড়ানো সাধারণত নির্ভুলতা বৃদ্ধি করে; যাইহোক, আমরা থ্রেশহোল্ড বাড়াতে গিয়ে নির্ভুলতা একঘেয়েভাবে বাড়ানোর নিশ্চয়তা দেওয়া হয় না।
সম্ভবত বৃদ্ধি।
সাধারণভাবে, শ্রেণীবিন্যাস থ্রেশহোল্ড বাড়ানো মিথ্যা ইতিবাচক হ্রাস করে, এইভাবে নির্ভুলতা বাড়ায়।
সম্ভবত কমবে।
সাধারণভাবে, শ্রেণীবিন্যাস থ্রেশহোল্ড বাড়ানো মিথ্যা ইতিবাচক হ্রাস করে, এইভাবে নির্ভুলতা বাড়ায়।
অবশ্যই কমবে।
সাধারণভাবে, শ্রেণীবিন্যাস থ্রেশহোল্ড বাড়ানো মিথ্যা ইতিবাচক হ্রাস করে, এইভাবে নির্ভুলতা বাড়ায়।

নীচের বিকল্পগুলি অন্বেষণ করুন.

একটি শ্রেণিবিন্যাস মডেল বিবেচনা করুন যা ইমেলকে দুটি বিভাগে বিভক্ত করে: "স্প্যাম" বা "স্প্যাম নয়।" আপনি যদি শ্রেণীবিভাগের থ্রেশহোল্ড বাড়ান, তাহলে প্রত্যাহার করার কী হবে?
সবসময় বৃদ্ধি.
শ্রেণীবিন্যাস থ্রেশহোল্ড বাড়ানোর ফলে নিম্নলিখিত উভয়ই ঘটবে:
  • প্রকৃত ইতিবাচক সংখ্যা কমবে বা একই থাকবে।
  • মিথ্যা নেতিবাচক সংখ্যা বাড়বে বা একই থাকবে।
সুতরাং, স্মরণ বাড়বে না।
সর্বদা হ্রাস করুন বা একই থাকুন।
আমাদের শ্রেণীবিভাগের থ্রেশহোল্ড বাড়ানোর ফলে সত্যিকারের ইতিবাচক সংখ্যা কমে যাবে বা একই থাকবে এবং মিথ্যা নেতিবাচকের সংখ্যা বৃদ্ধি পাবে বা একই থাকবে। এইভাবে, প্রত্যাহার হয় স্থির থাকবে বা হ্রাস পাবে।
সর্বদা অবিচল থাকুন।
আমাদের শ্রেণীবিভাগের থ্রেশহোল্ড বাড়ানোর ফলে সত্যিকারের ইতিবাচক সংখ্যা কমে যাবে বা একই থাকবে এবং মিথ্যা নেতিবাচকের সংখ্যা বৃদ্ধি পাবে বা একই থাকবে। এইভাবে, প্রত্যাহার হয় স্থির থাকবে বা হ্রাস পাবে।

নীচের বিকল্পগুলি অন্বেষণ করুন.

দুটি মডেল বিবেচনা করুন - A এবং B - যেগুলি প্রতিটি একই ডেটাসেটকে মূল্যায়ন করে৷ নিচের কোন বিবৃতিটি সত্য?
যদি মডেল A মডেল B এর চেয়ে ভাল নির্ভুলতা থাকে, তাহলে মডেল A ভাল।
যদিও ভাল নির্ভুলতা ভাল, এটি প্রত্যাহারে একটি বড় হ্রাসের ব্যয়ে আসতে পারে। সাধারণভাবে, আমাদের যথার্থতা এবং প্রত্যাহার উভয়কেই একসাথে দেখতে হবে, বা AUC-এর মতো সারাংশ মেট্রিক্স যা আমরা পরবর্তীতে আলোচনা করব।
যদি মডেল A-এর মডেল B এর চেয়ে ভাল রিকল থাকে তবে মডেল A আরও ভাল।
যদিও আরও ভাল স্মরণ করা ভাল, এটি স্পষ্টতার একটি বড় হ্রাসের ব্যয়ে আসতে পারে। সাধারণভাবে, আমাদের যথার্থতা এবং প্রত্যাহার উভয়কেই একসাথে দেখতে হবে, বা AUC-এর মতো সারাংশ মেট্রিক, যা আমরা পরবর্তীতে আলোচনা করব।
মডেল A এর যদি মডেল B এর চেয়ে ভাল নির্ভুলতা এবং ভাল স্মরণ থাকে তবে মডেল A সম্ভবত ভাল।
সাধারণভাবে, একটি মডেল যা নির্ভুলতা এবং প্রত্যাহার উভয় ক্ষেত্রেই অন্য মডেলকে ছাড়িয়ে যায় সম্ভবত ভাল মডেল। স্পষ্টতই, আমাদের নিশ্চিত করতে হবে যে তুলনাটি একটি নির্ভুলতা/রিকল পয়েন্টে করা হচ্ছে যা এটি অর্থপূর্ণ হওয়ার জন্য অনুশীলনে কার্যকর। উদাহরণ স্বরূপ, ধরুন আমাদের স্প্যাম শনাক্তকরণ মডেলকে উপযোগী হতে এবং অপ্রয়োজনীয় মিথ্যা অ্যালার্ম এড়াতে কমপক্ষে 90% নির্ভুলতা থাকা দরকার। এই ক্ষেত্রে, একটি মডেলের সাথে {20% নির্ভুলতা, 99% রিকল} তুলনা করা অন্যটির সাথে {15% নির্ভুলতা, 98% রিকল} বিশেষভাবে শিক্ষামূলক নয়, কারণ কোনো মডেলই 90% নির্ভুলতার প্রয়োজনীয়তা পূরণ করে না। কিন্তু সেই সতর্কতা মাথায় রেখে, নির্ভুলতা এবং স্মরণ ব্যবহার করার সময় মডেলগুলির তুলনা করার বিষয়ে চিন্তা করার এটি একটি ভাল উপায়।