লিনিয়ার রিগ্রেশন

এই মডিউলটি রৈখিক রিগ্রেশন ধারণাগুলি উপস্থাপন করে।

লিনিয়ার রিগ্রেশন হল একটি পরিসংখ্যানগত কৌশল যা ভেরিয়েবলের মধ্যে সম্পর্ক খুঁজে বের করতে ব্যবহৃত হয়। একটি ML প্রসঙ্গে, লিনিয়ার রিগ্রেশন বৈশিষ্ট্য এবং একটি লেবেলের মধ্যে সম্পর্ক খুঁজে বের করে।

উদাহরণস্বরূপ, ধরুন আমরা গাড়ির ওজনের উপর ভিত্তি করে প্রতি গ্যালনে মাইল প্রতি একটি গাড়ির জ্বালানি দক্ষতা অনুমান করতে চাই, এবং আমাদের কাছে নিম্নলিখিত ডেটাসেট আছে:

১০০০ সেকেন্ডে পাউন্ড (বৈশিষ্ট্য) মাইল প্রতি গ্যালন (লেবেল)
৩.৫ ১৮
৩.৬৯ ১৫
৩.৪৪ ১৮
৩.৪৩ ১৬
৪.৩৪ ১৫
৪.৪২ ১৪
২.৩৭ ২৪

যদি আমরা এই বিন্দুগুলি প্লট করি, তাহলে আমরা নিম্নলিখিত গ্রাফটি পাব:

চিত্র ১. বাম থেকে ডানে নিম্নমুখী প্রবণতা দেখাচ্ছে এমন ডেটা পয়েন্ট।

চিত্র ১। গাড়ির ভারীতা (পাউন্ডে) বনাম মাইল প্রতি গ্যালন রেটিং। একটি গাড়ি যত ভারী হয়, তার মাইল প্রতি গ্যালন রেটিং সাধারণত হ্রাস পায়।

আমরা নিম্নলিখিত পয়েন্টগুলির মধ্য দিয়ে একটি সর্বোত্তম ফিট রেখা টেনে আমাদের নিজস্ব মডেল তৈরি করতে পারি:

চিত্র ২। ডেটা পয়েন্ট, যার মধ্য দিয়ে একটি সর্বোত্তম ফিট রেখা টানা হয়েছে যা মডেলটিকে প্রতিনিধিত্ব করে।

চিত্র ২। পূর্ববর্তী চিত্রের তথ্যের মধ্য দিয়ে টানা একটি সর্বোত্তম ফিট রেখা।

রৈখিক রিগ্রেশন সমীকরণ

বীজগণিতের ভাষায়, মডেলটিকে $ y = mx + b $ হিসাবে সংজ্ঞায়িত করা হবে, যেখানে

  • $ y $ হল প্রতি গ্যালনে মাইল—যে মানটি আমরা ভবিষ্যদ্বাণী করতে চাই।
  • $ m $ হল রেখার ঢাল।
  • $ x $ হল পাউন্ড—আমাদের ইনপুট মান।
  • $ b $ হল y-ইন্টারসেপ্ট।

ML-এ, আমরা একটি রৈখিক রিগ্রেশন মডেলের সমীকরণটি নিম্নরূপ লিখি:

$$ y' = b + w_1x_1 $$

কোথায়:

  • $ y' $ হল পূর্বাভাসিত লেবেল—আউটপুট।
  • $ b $ হল মডেলের পক্ষপাত । পক্ষপাত হল একটি রেখার বীজগণিতীয় সমীকরণে y-ইন্টারসেপ্টের মতো একই ধারণা। ML-তে, পক্ষপাতকে কখনও কখনও $ w_0 $ বলা হয়। পক্ষপাত হল মডেলের একটি প্যারামিটার এবং প্রশিক্ষণের সময় গণনা করা হয়।
  • $ w_1 $ হল বৈশিষ্ট্যের ওজন । ওজন হল একটি রেখার বীজগণিতীয় সমীকরণে ঢাল $ m $ এর ধারণার মতোই। ওজন হল মডেলের একটি প্যারামিটার এবং প্রশিক্ষণের সময় গণনা করা হয়।
  • $ x_1 $ হল একটি বৈশিষ্ট্য — ইনপুট।

প্রশিক্ষণের সময়, মডেলটি ওজন এবং পক্ষপাত গণনা করে যা সেরা মডেল তৈরি করে।

চিত্র ৩। y' = b + w1x1 সমীকরণ, প্রতিটি উপাদানের উদ্দেশ্য টীকা সহ।

চিত্র ৩। একটি রৈখিক মডেলের গাণিতিক উপস্থাপনা।

আমাদের উদাহরণে, আমরা যে রেখাটি আঁকলাম তার উপর ভিত্তি করে ওজন এবং পক্ষপাত গণনা করব। পক্ষপাত হল 34 (যেখানে রেখাটি y-অক্ষকে ছেদ করে), এবং ওজন হল -4.6 (রেখার ঢাল)। মডেলটিকে $ y' = 34 + (-4.6)(x_1) $ হিসাবে সংজ্ঞায়িত করা হবে, এবং আমরা ভবিষ্যদ্বাণী করার জন্য এটি ব্যবহার করতে পারি। উদাহরণস্বরূপ, এই মডেলটি ব্যবহার করে, একটি 4,000-পাউন্ড গাড়ির প্রতি গ্যালনে 15.6 মাইল জ্বালানি দক্ষতার পূর্বাভাস থাকবে।

চিত্র ৪। চিত্র ২-এর মতো একই গ্রাফ, বিন্দু (৪, ১৫.৬) হাইলাইট করে।

চিত্র ৪. মডেলটি ব্যবহার করে, ৪,০০০ পাউন্ড ওজনের একটি গাড়ির জ্বালানি দক্ষতা প্রতি গ্যালনে ১৫.৬ মাইল হওয়ার পূর্বাভাস দেওয়া হয়েছে।

একাধিক বৈশিষ্ট্য সহ মডেল

যদিও এই বিভাগের উদাহরণে শুধুমাত্র একটি বৈশিষ্ট্য ব্যবহার করা হয়েছে - গাড়ির ভারীতা - একটি আরও পরিশীলিত মডেল একাধিক বৈশিষ্ট্যের উপর নির্ভর করতে পারে, প্রতিটির আলাদা ওজন ($ w_1 $, $ w_2 $, ইত্যাদি)। উদাহরণস্বরূপ, পাঁচটি বৈশিষ্ট্যের উপর নির্ভর করে এমন একটি মডেল নিম্নরূপ লেখা হবে:

$y' = b + w_1x_1 + w_2x_2 + w_3x_3 + w_4x_4 + w_5x_5 $

উদাহরণস্বরূপ, একটি মডেল যা গ্যাস মাইলেজ ভবিষ্যদ্বাণী করে সেগুলিতে নিম্নলিখিত বৈশিষ্ট্যগুলি অতিরিক্তভাবে ব্যবহার করা যেতে পারে:

  • ইঞ্জিন স্থানচ্যুতি
  • ত্বরণ
  • সিলিন্ডারের সংখ্যা
  • অশ্বশক্তি

এই মডেলটি নিম্নরূপ লেখা হবে:

চিত্র ৫। পাঁচটি বৈশিষ্ট্য সহ রৈখিক রিগ্রেশন সমীকরণ।

চিত্র ৫। পাঁচটি বৈশিষ্ট্য সহ একটি মডেল যা একটি গাড়ির মাইল প্রতি গ্যালন রেটিং পূর্বাভাস দিতে পারে।

এই অতিরিক্ত বৈশিষ্ট্যগুলির কয়েকটি গ্রাফ করে আমরা দেখতে পাচ্ছি যে তাদের লেবেলের সাথে একটি রৈখিক সম্পর্ক রয়েছে, প্রতি গ্যালনে মাইল:

চিত্র ৬। প্রতি গ্যালনে মাইলের বিপরীতে গ্রাফ করা ঘন সেন্টিমিটারে স্থানচ্যুতি একটি ঋণাত্মক রৈখিক সম্পর্ক দেখায়।

চিত্র ৬। ঘন সেন্টিমিটারে একটি গাড়ির স্থানচ্যুতি এবং প্রতি গ্যালনে এর মাইল রেটিং। একটি গাড়ির ইঞ্জিন যত বড় হয়, প্রতি গ্যালনে এর মাইল রেটিং সাধারণত হ্রাস পায়।

চিত্র ৭। শূন্য থেকে ষাট সেকেন্ডে ত্বরণ, প্রতি গ্যালনে মাইলের বিপরীতে গ্রাফ করা হয়েছে, যা একটি ইতিবাচক রৈখিক সম্পর্ক দেখায়।

চিত্র ৭। একটি গাড়ির ত্বরণ এবং তার মাইল প্রতি গ্যালন রেটিং। একটি গাড়ির ত্বরণ যত বেশি সময় নেয়, ততই মাইল প্রতি গ্যালন রেটিং সাধারণত বৃদ্ধি পায়।

অনুশীলন: আপনার বোধগম্যতা পরীক্ষা করুন

প্রশিক্ষণের সময় রৈখিক রিগ্রেশন সমীকরণের কোন অংশগুলি আপডেট করা হয়?
পক্ষপাত এবং ওজন
প্রশিক্ষণের সময়, মডেলটি পক্ষপাত এবং ওজন আপডেট করে।
ভবিষ্যদ্বাণী
প্রশিক্ষণের সময় ভবিষ্যদ্বাণী আপডেট করা হয় না।
বৈশিষ্ট্যের মান
বৈশিষ্ট্যের মানগুলি ডেটাসেটের অংশ, তাই প্রশিক্ষণের সময় সেগুলি আপডেট করা হয় না।