(তত্ত্বাবধানে) মেশিন লার্নিং কি? সংক্ষেপে বলা যায়, এটি নিম্নরূপ:
- এমএল সিস্টেমগুলি শেখে কিভাবে ইনপুট একত্রিত করতে হয় যাতে পূর্বে কখনও দেখা যায় নি এমন ডেটাতে দরকারী ভবিষ্যদ্বাণী তৈরি করা যায়।
আসুন মৌলিক মেশিন লার্নিং পরিভাষা অন্বেষণ করি।
লেবেল
একটি লেবেল হল এমন জিনিস যা আমরা ভবিষ্যদ্বাণী করছি - সরল রৈখিক রিগ্রেশনে y
পরিবর্তনশীল। লেবেল হতে পারে গমের ভবিষ্যৎ মূল্য, ছবিতে দেখানো প্রাণীর ধরন, একটি অডিও ক্লিপের অর্থ, বা প্রায় যেকোনো কিছু।
বৈশিষ্ট্য
একটি বৈশিষ্ট্য হল একটি ইনপুট ভেরিয়েবল- সরল রৈখিক রিগ্রেশনে x
ভেরিয়েবল। একটি সাধারণ মেশিন লার্নিং প্রকল্প একটি একক বৈশিষ্ট্য ব্যবহার করতে পারে, যখন একটি আরও পরিশীলিত মেশিন লার্নিং প্রকল্প লক্ষ লক্ষ বৈশিষ্ট্য ব্যবহার করতে পারে, যেমন উল্লেখ করা হয়েছে:
\[\\{x_1, x_2, ... x_N\\}\]
স্প্যাম ডিটেক্টর উদাহরণে, বৈশিষ্ট্যগুলির মধ্যে নিম্নলিখিতগুলি অন্তর্ভুক্ত থাকতে পারে:
- ইমেইল টেক্সট শব্দ
- প্রেরকের ঠিকানা
- দিনের সময় ইমেল পাঠানো হয়েছে
- ইমেইলে "একটি অদ্ভুত কৌশল" বাক্যাংশ রয়েছে।
উদাহরণ
একটি উদাহরণ হল ডেটার একটি বিশেষ উদাহরণ, x । (এটি একটি ভেক্টর বোঝাতে আমরা x কে বোল্ডফেসে রাখি।) আমরা উদাহরণগুলিকে দুটি বিভাগে বিভক্ত করি:
- লেবেলযুক্ত উদাহরণ
- লেবেলবিহীন উদাহরণ
একটি লেবেলযুক্ত উদাহরণে বৈশিষ্ট্য(গুলি) এবং লেবেল উভয়ই অন্তর্ভুক্ত থাকে। এটাই:
labeled examples: {features, label}: (x, y)
মডেলকে প্রশিক্ষণ দিতে লেবেলযুক্ত উদাহরণ ব্যবহার করুন। আমাদের স্প্যাম সনাক্তকারী উদাহরণে, লেবেলযুক্ত উদাহরণগুলি পৃথক ইমেল হবে যা ব্যবহারকারীরা স্পষ্টভাবে "স্প্যাম" বা "স্প্যাম নয়" হিসাবে চিহ্নিত করেছে৷
উদাহরণস্বরূপ, নিম্নলিখিত সারণীটি ক্যালিফোর্নিয়ায় আবাসন মূল্য সম্পর্কে তথ্য ধারণকারী একটি ডেটা সেট থেকে 5টি লেবেলযুক্ত উদাহরণ দেখায়:
হাউজিং মিডিয়ানএজ (বৈশিষ্ট্য) | মোট কক্ষ (বৈশিষ্ট্য) | মোট বেডরুম (বৈশিষ্ট্য) | মধ্যম হাউস ভ্যালু (লেবেল) |
---|---|---|---|
15 | 5612 | 1283 | 66900 |
19 | 7650 | 1901 | 80100 |
17 | 720 | 174 | 85700 |
14 | 1501 | 337 | 73400 |
20 | 1454 | 326 | 65500 |
লেবেলবিহীন উদাহরণে বৈশিষ্ট্য রয়েছে কিন্তু লেবেল নেই। এটাই:
unlabeled examples: {features, ?}: (x, ?)
এখানে একই হাউজিং ডেটাসেট থেকে লেবেলবিহীন 3টি উদাহরণ রয়েছে, যা medianHouseValue
বাদ দেয়:
হাউজিং মিডিয়ানএজ (বৈশিষ্ট্য) | মোট কক্ষ (বৈশিষ্ট্য) | মোট বেডরুম (বৈশিষ্ট্য) |
---|---|---|
42 | 1686 | 361 |
34 | 1226 | 180 |
33 | 1077 | 271 |
একবার আমরা লেবেলযুক্ত উদাহরণগুলির সাথে আমাদের মডেলকে প্রশিক্ষিত করার পরে, লেবেলবিহীন উদাহরণগুলিতে লেবেলের পূর্বাভাস দিতে আমরা সেই মডেলটি ব্যবহার করি। স্প্যাম ডিটেক্টরে, লেবেলবিহীন উদাহরণ হল নতুন ইমেল যা মানুষ এখনও লেবেল করেনি।
মডেল
একটি মডেল বৈশিষ্ট্য এবং লেবেলের মধ্যে সম্পর্ক সংজ্ঞায়িত করে। উদাহরণস্বরূপ, একটি স্প্যাম সনাক্তকরণ মডেল কিছু বৈশিষ্ট্যকে "স্প্যাম" এর সাথে দৃঢ়ভাবে যুক্ত করতে পারে। আসুন একজন মডেলের জীবনের দুটি পর্যায় হাইলাইট করি:
প্রশিক্ষণ মানে মডেল তৈরি করা বা শেখা । অর্থাৎ, আপনি মডেল লেবেলযুক্ত উদাহরণগুলি দেখান এবং মডেলটিকে ধীরে ধীরে বৈশিষ্ট্য এবং লেবেলের মধ্যে সম্পর্ক শিখতে সক্ষম করুন৷
অনুমান মানে লেবেলবিহীন উদাহরণে প্রশিক্ষিত মডেল প্রয়োগ করা। অর্থাৎ, আপনি দরকারী ভবিষ্যদ্বাণী করতে প্রশিক্ষিত মডেল ব্যবহার করুন (
y'
)। উদাহরণস্বরূপ, অনুমানের সময়, আপনি লেবেলবিহীন নতুন উদাহরণগুলির জন্যmedianHouseValue
ভবিষ্যদ্বাণী করতে পারেন।
রিগ্রেশন বনাম শ্রেণীবিভাগ
একটি রিগ্রেশন মডেল অবিচ্ছিন্ন মান ভবিষ্যদ্বাণী করে। উদাহরণস্বরূপ, রিগ্রেশন মডেলগুলি ভবিষ্যদ্বাণী করে যা নিম্নলিখিত প্রশ্নের উত্তর দেয়:
ক্যালিফোর্নিয়ায় একটি বাড়ির মূল্য কত?
একজন ব্যবহারকারী এই বিজ্ঞাপনে ক্লিক করার সম্ভাবনা কত?
একটি শ্রেণীবিভাগ মডেল বিচ্ছিন্ন মান ভবিষ্যদ্বাণী করে। উদাহরণস্বরূপ, শ্রেণিবিন্যাস মডেলগুলি ভবিষ্যদ্বাণী করে যা নিম্নলিখিতগুলির মতো প্রশ্নের উত্তর দেয়:
একটি প্রদত্ত ইমেল বার্তা স্প্যাম নাকি স্প্যাম নয়?
এটি কি কুকুর, বিড়াল বা হ্যামস্টারের ছবি?