ফ্রেমিং: কী ML পরিভাষা

(তত্ত্বাবধানে) মেশিন লার্নিং কি? সংক্ষেপে বলা যায়, এটি নিম্নরূপ:

  • এমএল সিস্টেমগুলি শেখে কিভাবে ইনপুট একত্রিত করতে হয় যাতে পূর্বে কখনও দেখা যায় নি এমন ডেটাতে দরকারী ভবিষ্যদ্বাণী তৈরি করা যায়।

আসুন মৌলিক মেশিন লার্নিং পরিভাষা অন্বেষণ করি।

লেবেল

একটি লেবেল হল এমন জিনিস যা আমরা ভবিষ্যদ্বাণী করছি - সরল রৈখিক রিগ্রেশনে y পরিবর্তনশীল। লেবেল হতে পারে গমের ভবিষ্যৎ মূল্য, ছবিতে দেখানো প্রাণীর ধরন, একটি অডিও ক্লিপের অর্থ, বা প্রায় যেকোনো কিছু।

বৈশিষ্ট্য

একটি বৈশিষ্ট্য হল একটি ইনপুট ভেরিয়েবল- সরল রৈখিক রিগ্রেশনে x ভেরিয়েবল। একটি সাধারণ মেশিন লার্নিং প্রকল্প একটি একক বৈশিষ্ট্য ব্যবহার করতে পারে, যখন একটি আরও পরিশীলিত মেশিন লার্নিং প্রকল্প লক্ষ লক্ষ বৈশিষ্ট্য ব্যবহার করতে পারে, যেমন উল্লেখ করা হয়েছে:

\[\\{x_1, x_2, ... x_N\\}\]

স্প্যাম ডিটেক্টর উদাহরণে, বৈশিষ্ট্যগুলির মধ্যে নিম্নলিখিতগুলি অন্তর্ভুক্ত থাকতে পারে:

  • ইমেইল টেক্সট শব্দ
  • প্রেরকের ঠিকানা
  • দিনের সময় ইমেল পাঠানো হয়েছে
  • ইমেইলে "একটি অদ্ভুত কৌশল" বাক্যাংশ রয়েছে।

উদাহরণ

একটি উদাহরণ হল ডেটার একটি বিশেষ উদাহরণ, x । (এটি একটি ভেক্টর বোঝাতে আমরা x কে বোল্ডফেসে রাখি।) আমরা উদাহরণগুলিকে দুটি বিভাগে বিভক্ত করি:

  • লেবেলযুক্ত উদাহরণ
  • লেবেলবিহীন উদাহরণ

একটি লেবেলযুক্ত উদাহরণে বৈশিষ্ট্য(গুলি) এবং লেবেল উভয়ই অন্তর্ভুক্ত থাকে। এটাই:

  labeled examples: {features, label}: (x, y)

মডেলকে প্রশিক্ষণ দিতে লেবেলযুক্ত উদাহরণ ব্যবহার করুন। আমাদের স্প্যাম সনাক্তকারী উদাহরণে, লেবেলযুক্ত উদাহরণগুলি পৃথক ইমেল হবে যা ব্যবহারকারীরা স্পষ্টভাবে "স্প্যাম" বা "স্প্যাম নয়" হিসাবে চিহ্নিত করেছে৷

উদাহরণস্বরূপ, নিম্নলিখিত সারণীটি ক্যালিফোর্নিয়ায় আবাসন মূল্য সম্পর্কে তথ্য ধারণকারী একটি ডেটা সেট থেকে 5টি লেবেলযুক্ত উদাহরণ দেখায়:

হাউজিং মিডিয়ানএজ
(বৈশিষ্ট্য)
মোট কক্ষ
(বৈশিষ্ট্য)
মোট বেডরুম
(বৈশিষ্ট্য)
মধ্যম হাউস ভ্যালু
(লেবেল)
15 5612 1283 66900
19 7650 1901 80100
17 720 174 85700
14 1501 337 73400
20 1454 326 65500

লেবেলবিহীন উদাহরণে বৈশিষ্ট্য রয়েছে কিন্তু লেবেল নেই। এটাই:

  unlabeled examples: {features, ?}: (x, ?)

এখানে একই হাউজিং ডেটাসেট থেকে লেবেলবিহীন 3টি উদাহরণ রয়েছে, যা medianHouseValue বাদ দেয়:

হাউজিং মিডিয়ানএজ
(বৈশিষ্ট্য)
মোট কক্ষ
(বৈশিষ্ট্য)
মোট বেডরুম
(বৈশিষ্ট্য)
42 1686 361
34 1226 180
33 1077 271

একবার আমরা লেবেলযুক্ত উদাহরণগুলির সাথে আমাদের মডেলকে প্রশিক্ষিত করার পরে, লেবেলবিহীন উদাহরণগুলিতে লেবেলের পূর্বাভাস দিতে আমরা সেই মডেলটি ব্যবহার করি। স্প্যাম ডিটেক্টরে, লেবেলবিহীন উদাহরণ হল নতুন ইমেল যা মানুষ এখনও লেবেল করেনি।

মডেল

একটি মডেল বৈশিষ্ট্য এবং লেবেলের মধ্যে সম্পর্ক সংজ্ঞায়িত করে। উদাহরণস্বরূপ, একটি স্প্যাম সনাক্তকরণ মডেল কিছু বৈশিষ্ট্যকে "স্প্যাম" এর সাথে দৃঢ়ভাবে যুক্ত করতে পারে। আসুন একজন মডেলের জীবনের দুটি পর্যায় হাইলাইট করি:

  • প্রশিক্ষণ মানে মডেল তৈরি করা বা শেখা । অর্থাৎ, আপনি মডেল লেবেলযুক্ত উদাহরণগুলি দেখান এবং মডেলটিকে ধীরে ধীরে বৈশিষ্ট্য এবং লেবেলের মধ্যে সম্পর্ক শিখতে সক্ষম করুন৷

  • অনুমান মানে লেবেলবিহীন উদাহরণে প্রশিক্ষিত মডেল প্রয়োগ করা। অর্থাৎ, আপনি দরকারী ভবিষ্যদ্বাণী করতে প্রশিক্ষিত মডেল ব্যবহার করুন ( y' )। উদাহরণস্বরূপ, অনুমানের সময়, আপনি লেবেলবিহীন নতুন উদাহরণগুলির জন্য medianHouseValue ভবিষ্যদ্বাণী করতে পারেন।

রিগ্রেশন বনাম শ্রেণীবিভাগ

একটি রিগ্রেশন মডেল অবিচ্ছিন্ন মান ভবিষ্যদ্বাণী করে। উদাহরণস্বরূপ, রিগ্রেশন মডেলগুলি ভবিষ্যদ্বাণী করে যা নিম্নলিখিত প্রশ্নের উত্তর দেয়:

  • ক্যালিফোর্নিয়ায় একটি বাড়ির মূল্য কত?

  • একজন ব্যবহারকারী এই বিজ্ঞাপনে ক্লিক করার সম্ভাবনা কত?

একটি শ্রেণীবিভাগ মডেল বিচ্ছিন্ন মান ভবিষ্যদ্বাণী করে। উদাহরণস্বরূপ, শ্রেণিবিন্যাস মডেলগুলি ভবিষ্যদ্বাণী করে যা নিম্নলিখিতগুলির মতো প্রশ্নের উত্তর দেয়:

  • একটি প্রদত্ত ইমেল বার্তা স্প্যাম নাকি স্প্যাম নয়?

  • এটি কি কুকুর, বিড়াল বা হ্যামস্টারের ছবি?