ML-এ অবতরণ: লিনিয়ার রিগ্রেশন

এটা অনেক আগে থেকেই জানা ছিল যে ক্রিকেট (একটি কীটপতঙ্গের প্রজাতি) শীতল দিনের তুলনায় গরমের দিনে বেশি ঘনঘন কিচিরমিচির করে। কয়েক দশক ধরে, পেশাদার এবং অপেশাদার বিজ্ঞানীরা কিচিরমিচির-প্রতি-মিনিট এবং তাপমাত্রার ডেটা তালিকাভুক্ত করেছেন। জন্মদিনের উপহার হিসাবে, আপনার আন্টি রুথ আপনাকে তার ক্রিকেট ডাটাবেস দেন এবং এই সম্পর্কের পূর্বাভাস দেওয়ার জন্য আপনাকে একটি মডেল শিখতে বলেন। এই তথ্য ব্যবহার করে, আপনি এই সম্পর্ক অন্বেষণ করতে চান.

প্রথমে, এটি প্লট করে আপনার ডেটা পরীক্ষা করুন:

কিচিরমিচির/মিনিট (x-অক্ষ) বনাম তাপমাত্রা (y-অক্ষ) এর কাঁচা ডেটা।

চিত্র 1. প্রতি মিনিটে চির্পস বনাম সেলসিয়াসে তাপমাত্রা।

প্রত্যাশিত হিসাবে, প্লটটি দেখায় যে কিচিরমিচির সংখ্যার সাথে তাপমাত্রা বাড়ছে৷ কিচিরমিচির এবং তাপমাত্রার মধ্যে এই সম্পর্ক কি রৈখিক? হ্যাঁ, আপনি এই সম্পর্কের আনুমানিক জন্য নিম্নলিখিত মত একটি একক সরল রেখা আঁকতে পারেন:

কিচিরমিচির/মিনিট (x-অক্ষ) বনাম তাপমাত্রার (y-অক্ষ) সম্পর্ক স্থাপনকারী সর্বোত্তম লাইন।

চিত্র 2. একটি রৈখিক সম্পর্ক।

সত্য, লাইনটি প্রতিটি বিন্দুর মধ্য দিয়ে যায় না, তবে লাইনটি স্পষ্টভাবে চিপস এবং তাপমাত্রার মধ্যে সম্পর্ক দেখায়। একটি লাইনের জন্য সমীকরণ ব্যবহার করে, আপনি এই সম্পর্কটি নিম্নরূপ লিখতে পারেন:

$$ y = mx + b $$

কোথায়:

  • \(y\) হল সেলসিয়াসে তাপমাত্রা - যে মানটি আমরা অনুমান করার চেষ্টা করছি৷
  • \(m\) হল লাইনের ঢাল।
  • \(x\) হল প্রতি মিনিটে কিচিরমিচির সংখ্যা—আমাদের ইনপুট বৈশিষ্ট্যের মান।
  • \(b\) হল y-ইন্টারসেপ্ট।

মেশিন লার্নিং এর নিয়ম অনুসারে, আপনি একটি মডেলের সমীকরণটি একটু ভিন্নভাবে লিখবেন:

$$ y' = b + w_1x_1 $$

কোথায়:

  • \(y'\) হল পূর্বাভাসিত লেবেল (একটি পছন্দসই আউটপুট)।
  • \(b\) হল পক্ষপাত (y-ইন্টারসেপ্ট), কখনও কখনও \(w_0\)হিসাবে উল্লেখ করা হয়।
  • \(w_1\) হল বৈশিষ্ট্য 1 এর ওজন। ওজন হল একটি লাইনের প্রথাগত সমীকরণে "ঢাল" \(m\) এর মতো একই ধারণা।
  • \(x_1\) একটি বৈশিষ্ট্য (একটি পরিচিত ইনপুট)।

একটি নতুন চিপস-প্রতি-মিনিট মান \(x_1\)placeholder14-এর জন্য তাপমাত্রা \(y'\) অনুমান (ভবিষ্যদ্বাণী) করতে, এই মডেলে শুধু \(x_1\) মান প্রতিস্থাপন করুন।

যদিও এই মডেলটি শুধুমাত্র একটি বৈশিষ্ট্য ব্যবহার করে, একটি আরও পরিশীলিত মডেল একাধিক বৈশিষ্ট্যের উপর নির্ভর করতে পারে, প্রতিটির আলাদা ওজন (\(w_1\), \(w_2\), ইত্যাদি)। উদাহরণস্বরূপ, একটি মডেল যা তিনটি বৈশিষ্ট্যের উপর নির্ভর করে তা নিম্নরূপ দেখতে পারে:

$$y' = b + w_1x_1 + w_2x_2 + w_3x_3$$