ক্ষতি হ্রাস: একটি পুনরাবৃত্তিমূলক পদ্ধতি

আগের মডিউলটি ক্ষতির ধারণাটি চালু করেছিল। এখানে, এই মডিউলে, আপনি শিখবেন কিভাবে একটি মেশিন লার্নিং মডেল পুনরাবৃত্তিমূলকভাবে ক্ষতি কমায়।

পুনরাবৃত্ত শিক্ষা আপনাকে "হট অ্যান্ড কোল্ড" বাচ্চার খেলার কথা মনে করিয়ে দিতে পারে যেটি ঠোঁটের মতো লুকানো বস্তু খুঁজে বের করার জন্য। এই গেমটিতে, "লুকানো বস্তু" হল সেরা সম্ভাব্য মডেল। আপনি একটি বন্য অনুমান দিয়ে শুরু করবেন (" \(w_1\) এর মান 0") এবং সিস্টেমের ক্ষতি কী তা আপনাকে জানানোর জন্য অপেক্ষা করুন৷ তারপরে, আপনি আরেকটি অনুমান চেষ্টা করবেন (" \(w_1\) এর মান 0.5।") এবং ক্ষতি কী তা দেখুন। আহ, আপনি গরম হয়ে উঠছেন। প্রকৃতপক্ষে, আপনি যদি এই গেমটি সঠিকভাবে খেলেন তবে আপনি সাধারণত উষ্ণ হয়ে উঠবেন। গেমটির আসল কৌশলটি যথাসম্ভব দক্ষতার সাথে সেরা সম্ভাব্য মডেলটি খুঁজে বের করার চেষ্টা করছে।

নিম্নলিখিত চিত্রটি একটি মডেলকে প্রশিক্ষণ দেওয়ার জন্য মেশিন লার্নিং অ্যালগরিদম ব্যবহার করে পুনরাবৃত্তিমূলক ট্রায়াল-এন্ড-এরর প্রক্রিয়ার পরামর্শ দেয়:

বৈশিষ্ট্য এবং লেবেল থেকে মডেল এবং ভবিষ্যদ্বাণীতে যাওয়ার চক্র।

চিত্র 1. একটি মডেল প্রশিক্ষণের জন্য একটি পুনরাবৃত্তিমূলক পদ্ধতি।

আমরা মেশিন লার্নিং ক্র্যাশ কোর্স জুড়ে এই একই পুনরাবৃত্তিমূলক পদ্ধতি ব্যবহার করব, বিভিন্ন জটিলতার বিবরণ দিয়ে, বিশেষ করে "মডেল (পূর্বাভাস ফাংশন)" লেবেলযুক্ত সেই ঝড়ো মেঘের মধ্যে। মেশিন লার্নিংয়ে পুনরাবৃত্তিমূলক কৌশলগুলি প্রচলিত, প্রাথমিকভাবে কারণ তারা বৃহৎ ডেটা সেটগুলিতে এত ভাল মাপকাঠি।

"মডেল" ইনপুট হিসাবে এক বা একাধিক বৈশিষ্ট্য নেয় এবং আউটপুট হিসাবে একটি পূর্বাভাস প্রদান করে। সহজ করার জন্য, এমন একটি মডেল বিবেচনা করুন যা একটি বৈশিষ্ট্য (\(x_1\)) নেয় এবং একটি পূর্বাভাস দেয় (\(y'\)) :

$$ y' = b + w_1x_1 $$

\(b\)এবং \(w_1\)এর জন্য আমাদের কোন প্রাথমিক মান সেট করা উচিত? রৈখিক রিগ্রেশন সমস্যার জন্য, এটি দেখা যাচ্ছে যে প্রারম্ভিক মানগুলি গুরুত্বপূর্ণ নয়। আমরা এলোমেলো মান বাছাই করতে পারি, কিন্তু আমরা এর পরিবর্তে নিম্নলিখিত তুচ্ছ মানগুলি গ্রহণ করব:

  • \(b\) = 0
  • \(w_1\) = 0

ধরুন যে প্রথম বৈশিষ্ট্যের মান হল 10। সেই বৈশিষ্ট্যের মানটিকে পূর্বাভাস ফাংশনে প্লাগ করলে ফল পাওয়া যায়:

$$ y' = 0 + 0 \cdot 10 = 0 $$

ডায়াগ্রামের "কম্পিউট লস" অংশটি হল লস ফাংশন যা মডেলটি ব্যবহার করবে। ধরুন আমরা স্কোয়ারড লস ফাংশন ব্যবহার করি। ক্ষতি ফাংশন দুটি ইনপুট মান নেয়:

  • \(y'\): বৈশিষ্ট্য x এর জন্য মডেলের ভবিষ্যদ্বাণী
  • \(y\): বৈশিষ্ট্য x এর সাথে সম্পর্কিত সঠিক লেবেল।

অবশেষে, আমরা ডায়াগ্রামের "কম্পিউট প্যারামিটার আপডেট" অংশে পৌঁছেছি। এখানেই মেশিন লার্নিং সিস্টেম লস ফাংশনের মান পরীক্ষা করে এবং \(b\) এবং \(w_1\)এর জন্য নতুন মান তৈরি করে। আপাতত, শুধু অনুমান করুন যে এই রহস্যময় বাক্সটি নতুন মান তৈরি করে এবং তারপরে মেশিন লার্নিং সিস্টেম সেই সমস্ত বৈশিষ্ট্যগুলিকে সেই সমস্ত লেবেলের বিপরীতে পুনরায় মূল্যায়ন করে, ক্ষতির ফাংশনের জন্য একটি নতুন মান দেয়, যা নতুন প্যারামিটার মান দেয়। এবং অ্যালগরিদম সর্বনিম্ন সম্ভাব্য ক্ষতি সহ মডেল পরামিতিগুলি আবিষ্কার না করা পর্যন্ত শেখার পুনরাবৃত্তি অব্যাহত থাকে। সাধারণত, সামগ্রিক ক্ষতি পরিবর্তিত হওয়া বন্ধ না হওয়া পর্যন্ত বা কমপক্ষে অত্যন্ত ধীরে ধীরে পরিবর্তন না হওয়া পর্যন্ত আপনি পুনরাবৃত্তি করেন। যখন এটি ঘটে, আমরা বলি যে মডেলটি একত্রিত হয়েছে।