এই মডিউলটি রৈখিক রিগ্রেশন ধারণাগুলি উপস্থাপন করে।
লিনিয়ার রিগ্রেশন হল একটি পরিসংখ্যানগত কৌশল যা ভেরিয়েবলের মধ্যে সম্পর্ক খুঁজে বের করতে ব্যবহৃত হয়। একটি ML প্রসঙ্গে, লিনিয়ার রিগ্রেশন বৈশিষ্ট্য এবং একটি লেবেলের মধ্যে সম্পর্ক খুঁজে বের করে।
উদাহরণস্বরূপ, ধরুন আমরা গাড়ির ওজনের উপর ভিত্তি করে প্রতি গ্যালনে মাইল প্রতি একটি গাড়ির জ্বালানি দক্ষতা অনুমান করতে চাই, এবং আমাদের কাছে নিম্নলিখিত ডেটাসেট আছে:
| ১০০০ সেকেন্ডে পাউন্ড (বৈশিষ্ট্য) | মাইল প্রতি গ্যালন (লেবেল) |
|---|---|
| ৩.৫ | ১৮ |
| ৩.৬৯ | ১৫ |
| ৩.৪৪ | ১৮ |
| ৩.৪৩ | ১৬ |
| ৪.৩৪ | ১৫ |
| ৪.৪২ | ১৪ |
| ২.৩৭ | ২৪ |
যদি আমরা এই বিন্দুগুলি প্লট করি, তাহলে আমরা নিম্নলিখিত গ্রাফটি পাব:

চিত্র ১। গাড়ির ভারীতা (পাউন্ডে) বনাম মাইল প্রতি গ্যালন রেটিং। একটি গাড়ি যত ভারী হয়, তার মাইল প্রতি গ্যালন রেটিং সাধারণত হ্রাস পায়।
আমরা নিম্নলিখিত পয়েন্টগুলির মধ্য দিয়ে একটি সর্বোত্তম ফিট রেখা টেনে আমাদের নিজস্ব মডেল তৈরি করতে পারি:

চিত্র ২। পূর্ববর্তী চিত্রের তথ্যের মধ্য দিয়ে টানা একটি সর্বোত্তম ফিট রেখা।
রৈখিক রিগ্রেশন সমীকরণ
বীজগণিতের ভাষায়, মডেলটিকে $ y = mx + b $ হিসাবে সংজ্ঞায়িত করা হবে, যেখানে
- $ y $ হল প্রতি গ্যালনে মাইল—যে মানটি আমরা ভবিষ্যদ্বাণী করতে চাই।
- $ m $ হল রেখার ঢাল।
- $ x $ হল পাউন্ড—আমাদের ইনপুট মান।
- $ b $ হল y-ইন্টারসেপ্ট।
ML-এ, আমরা একটি রৈখিক রিগ্রেশন মডেলের সমীকরণটি নিম্নরূপ লিখি:
কোথায়:
- $ y' $ হল পূর্বাভাসিত লেবেল—আউটপুট।
- $ b $ হল মডেলের পক্ষপাত । পক্ষপাত হল একটি রেখার বীজগণিতীয় সমীকরণে y-ইন্টারসেপ্টের মতো একই ধারণা। ML-তে, পক্ষপাতকে কখনও কখনও $ w_0 $ বলা হয়। পক্ষপাত হল মডেলের একটি প্যারামিটার এবং প্রশিক্ষণের সময় গণনা করা হয়।
- $ w_1 $ হল বৈশিষ্ট্যের ওজন । ওজন হল একটি রেখার বীজগণিতীয় সমীকরণে ঢাল $ m $ এর ধারণার মতোই। ওজন হল মডেলের একটি প্যারামিটার এবং প্রশিক্ষণের সময় গণনা করা হয়।
- $ x_1 $ হল একটি বৈশিষ্ট্য — ইনপুট।
প্রশিক্ষণের সময়, মডেলটি ওজন এবং পক্ষপাত গণনা করে যা সেরা মডেল তৈরি করে।

চিত্র ৩। একটি রৈখিক মডেলের গাণিতিক উপস্থাপনা।
আমাদের উদাহরণে, আমরা যে রেখাটি আঁকলাম তার উপর ভিত্তি করে ওজন এবং পক্ষপাত গণনা করব। পক্ষপাত হল 34 (যেখানে রেখাটি y-অক্ষকে ছেদ করে), এবং ওজন হল -4.6 (রেখার ঢাল)। মডেলটিকে $ y' = 34 + (-4.6)(x_1) $ হিসাবে সংজ্ঞায়িত করা হবে, এবং আমরা ভবিষ্যদ্বাণী করার জন্য এটি ব্যবহার করতে পারি। উদাহরণস্বরূপ, এই মডেলটি ব্যবহার করে, একটি 4,000-পাউন্ড গাড়ির প্রতি গ্যালনে 15.6 মাইল জ্বালানি দক্ষতার পূর্বাভাস থাকবে।

চিত্র ৪. মডেলটি ব্যবহার করে, ৪,০০০ পাউন্ড ওজনের একটি গাড়ির জ্বালানি দক্ষতা প্রতি গ্যালনে ১৫.৬ মাইল হওয়ার পূর্বাভাস দেওয়া হয়েছে।
একাধিক বৈশিষ্ট্য সহ মডেল
যদিও এই বিভাগের উদাহরণে শুধুমাত্র একটি বৈশিষ্ট্য ব্যবহার করা হয়েছে - গাড়ির ভারীতা - একটি আরও পরিশীলিত মডেল একাধিক বৈশিষ্ট্যের উপর নির্ভর করতে পারে, প্রতিটির আলাদা ওজন ($ w_1 $, $ w_2 $, ইত্যাদি)। উদাহরণস্বরূপ, পাঁচটি বৈশিষ্ট্যের উপর নির্ভর করে এমন একটি মডেল নিম্নরূপ লেখা হবে:
$y' = b + w_1x_1 + w_2x_2 + w_3x_3 + w_4x_4 + w_5x_5 $
উদাহরণস্বরূপ, একটি মডেল যা গ্যাস মাইলেজ ভবিষ্যদ্বাণী করে সেগুলিতে নিম্নলিখিত বৈশিষ্ট্যগুলি অতিরিক্তভাবে ব্যবহার করা যেতে পারে:
- ইঞ্জিন স্থানচ্যুতি
- ত্বরণ
- সিলিন্ডারের সংখ্যা
- অশ্বশক্তি
এই মডেলটি নিম্নরূপ লেখা হবে:

চিত্র ৫। পাঁচটি বৈশিষ্ট্য সহ একটি মডেল যা একটি গাড়ির মাইল প্রতি গ্যালন রেটিং পূর্বাভাস দিতে পারে।
এই অতিরিক্ত বৈশিষ্ট্যগুলির কয়েকটি গ্রাফ করে আমরা দেখতে পাচ্ছি যে তাদের লেবেলের সাথে একটি রৈখিক সম্পর্ক রয়েছে, প্রতি গ্যালনে মাইল:

চিত্র ৬। ঘন সেন্টিমিটারে একটি গাড়ির স্থানচ্যুতি এবং প্রতি গ্যালনে এর মাইল রেটিং। একটি গাড়ির ইঞ্জিন যত বড় হয়, প্রতি গ্যালনে এর মাইল রেটিং সাধারণত হ্রাস পায়।

চিত্র ৭। একটি গাড়ির ত্বরণ এবং তার মাইল প্রতি গ্যালন রেটিং। একটি গাড়ির ত্বরণ যত বেশি সময় নেয়, ততই মাইল প্রতি গ্যালন রেটিং সাধারণত বৃদ্ধি পায়।