লিনিয়ার রিগ্রেশন: গ্রেডিয়েন্ট ডিসেন্ট

গ্রেডিয়েন্ট ডিসেন্ট হল একটি গাণিতিক কৌশল যা পুনরাবৃত্তভাবে ওজন এবং পক্ষপাত খুঁজে বের করে যা সর্বনিম্ন ক্ষতি সহ মডেল তৈরি করে। গ্রেডিয়েন্ট ডিসেন্ট ব্যবহারকারী-সংজ্ঞায়িত পুনরাবৃত্তির জন্য নিম্নলিখিত প্রক্রিয়াটি পুনরাবৃত্তি করে সর্বোত্তম ওজন এবং পক্ষপাত খুঁজে বের করে।

মডেলটি শূন্যের কাছাকাছি এলোমেলো ওজন এবং পক্ষপাত দিয়ে প্রশিক্ষণ শুরু করে এবং তারপর নিম্নলিখিত পদক্ষেপগুলি পুনরাবৃত্তি করে:

  1. বর্তমান ওজন এবং পক্ষপাত দিয়ে ক্ষতি গণনা করুন।

  2. ওজন এবং পক্ষপাত যা ক্ষতি কমায় তা সরানোর দিক নির্ধারণ করুন।

  3. ওজন এবং পক্ষপাতের মানগুলিকে এমন দিকে অল্প পরিমাণে সরান যা ক্ষতি হ্রাস করে।

  4. প্রথম ধাপে ফিরে যান এবং প্রক্রিয়াটি পুনরাবৃত্তি করুন যতক্ষণ না মডেলটি ক্ষতি আরও কমাতে পারে।

নিচের চিত্রটিতে গ্রেডিয়েন্ট ডিসেন্টের পুনরাবৃত্ত পদক্ষেপগুলি দেখানো হয়েছে যা ওজন এবং পক্ষপাত খুঁজে বের করার জন্য সর্বনিম্ন ক্ষতি সহ মডেল তৈরি করে।

চিত্র ১১। গ্রেডিয়েন্ট অবতরণ প্রক্রিয়ার চিত্রণ।

চিত্র ১১. গ্রেডিয়েন্ট ডিসেন্ট হল একটি পুনরাবৃত্ত প্রক্রিয়া যা ওজন এবং পক্ষপাত খুঁজে বের করে যা সর্বনিম্ন ক্ষতি সহ মডেল তৈরি করে।

মডেল কনভারজেন্স এবং লস কার্ভ

একটি মডেলকে প্রশিক্ষণ দেওয়ার সময়, আপনি প্রায়শই একটি ক্ষতির বক্ররেখা দেখেন যে মডেলটি একত্রিত হয়েছে কিনা। ক্ষতির বক্ররেখা দেখায় যে মডেলটি প্রশিক্ষণের সাথে সাথে ক্ষতি কীভাবে পরিবর্তিত হয়। একটি সাধারণ ক্ষতির বক্ররেখা নীচে দেখানো হল। ক্ষতি y-অক্ষে এবং পুনরাবৃত্তিগুলি x-অক্ষে থাকে:

চিত্র ১২। ক্ষতি বক্ররেখার গ্রাফ যেখানে একটি তীব্র পতন এবং তারপর একটি মৃদু পতন দেখা যাচ্ছে।

চিত্র ১২। ক্ষতির বক্ররেখা দেখায় যে মডেলটি ১০০০তম-পুনরাবৃত্তি চিহ্নের চারপাশে একত্রিত হচ্ছে।

আপনি দেখতে পাচ্ছেন যে প্রথম কয়েকটি পুনরাবৃত্তির সময় ক্ষতি নাটকীয়ভাবে হ্রাস পায়, তারপর ধীরে ধীরে হ্রাস পায় এবং ১,০০০ তম পুনরাবৃত্তির চিহ্নের কাছাকাছি চলে আসে। ১,০০০ পুনরাবৃত্তির পরে, আমরা বেশিরভাগ ক্ষেত্রে নিশ্চিত হতে পারি যে মডেলটি একত্রিত হয়েছে।

নিম্নলিখিত চিত্রগুলিতে, আমরা প্রশিক্ষণ প্রক্রিয়ার সময় তিনটি বিন্দুতে মডেলটি আঁকছি: শুরু, মাঝামাঝি এবং শেষ। প্রশিক্ষণ প্রক্রিয়ার সময় স্ন্যাপশটে মডেলের অবস্থা কল্পনা করা ওজন এবং পক্ষপাত আপডেট করা, ক্ষতি হ্রাস করা এবং মডেল অভিসৃতির মধ্যে যোগসূত্রকে দৃঢ় করে।

চিত্রগুলিতে, আমরা মডেলটি উপস্থাপন করার জন্য একটি নির্দিষ্ট পুনরাবৃত্তিতে প্রাপ্ত ওজন এবং পক্ষপাত ব্যবহার করি। ডেটা পয়েন্ট এবং মডেল স্ন্যাপশট সহ গ্রাফে, মডেল থেকে ডেটা পয়েন্ট পর্যন্ত নীল ক্ষতির রেখাগুলি ক্ষতির পরিমাণ দেখায়। রেখাগুলি যত দীর্ঘ হবে, ক্ষতি তত বেশি হবে।

নিচের চিত্রে, আমরা দেখতে পাচ্ছি যে দ্বিতীয় পুনরাবৃত্তির কাছাকাছি সময়ে মডেলটি ভবিষ্যদ্বাণী করতে ভালো হবে না কারণ ক্ষতির পরিমাণ বেশি।

চিত্র ১৩। মডেলের ক্ষতি বক্ররেখা এবং সংশ্লিষ্ট গ্রাফ, যা ডেটা পয়েন্ট থেকে দূরে হেলে থাকে।

চিত্র ১৩। প্রশিক্ষণ প্রক্রিয়ার শুরুতে মডেলের ক্ষতির বক্ররেখা এবং স্ন্যাপশট।

প্রায় ৪০০ তম পুনরাবৃত্তিতে, আমরা দেখতে পাচ্ছি যে গ্রেডিয়েন্ট ডিসেন্ট এমন ওজন এবং পক্ষপাত খুঁজে পেয়েছে যা একটি ভাল মডেল তৈরি করে।

চিত্র ১৪। মডেলের ক্ষতি বক্ররেখা এবং সংশ্লিষ্ট গ্রাফ, যা ডেটা পয়েন্টগুলি কেটে দেয় কিন্তু সর্বোত্তম কোণে নয়।

চিত্র ১৪। প্রশিক্ষণের মাঝামাঝি সময়ে মডেলের ক্ষতির বক্ররেখা এবং স্ন্যাপশট।

এবং প্রায় ১০০০তম পুনরাবৃত্তিতে, আমরা দেখতে পাচ্ছি যে মডেলটি একত্রিত হয়েছে, সর্বনিম্ন সম্ভাব্য ক্ষতি সহ একটি মডেল তৈরি করেছে।

চিত্র ১৫। মডেলের ক্ষতি বক্ররেখা এবং সংশ্লিষ্ট গ্রাফ, যা ডেটার সাথে ভালোভাবে খাপ খায়।

চিত্র ১৫। প্রশিক্ষণ প্রক্রিয়ার শেষের দিকে মডেলের ক্ষতির বক্ররেখা এবং স্ন্যাপশট।

অনুশীলন: আপনার বোধগম্যতা পরীক্ষা করুন

রৈখিক রিগ্রেশনে গ্রেডিয়েন্ট ডিসেন্টের ভূমিকা কী?
গ্রেডিয়েন্ট ডিসেন্ট হল একটি পুনরাবৃত্তিমূলক প্রক্রিয়া যা সর্বোত্তম ওজন এবং পক্ষপাত খুঁজে বের করে যা ক্ষতি কমিয়ে দেয়।
গ্রেডিয়েন্ট ডিসেন্ট একটি মডেলকে প্রশিক্ষণ দেওয়ার সময় কোন ধরণের ক্ষতি ব্যবহার করতে হবে তা নির্ধারণ করতে সাহায্য করে, উদাহরণস্বরূপ, L 1 বা L 2
মডেল প্রশিক্ষণের জন্য লস ফাংশন নির্বাচনের ক্ষেত্রে গ্রেডিয়েন্ট ডিসেন্ট জড়িত নয়।
মডেলটিকে আরও ভালো ভবিষ্যদ্বাণী করতে সাহায্য করার জন্য গ্রেডিয়েন্ট ডিসেন্ট ডেটাসেট থেকে আউটলায়ারগুলি সরিয়ে দেয়।
গ্রেডিয়েন্ট ডিসেন্ট ডেটাসেট পরিবর্তন করে না।

অভিসরণ এবং উত্তল ফাংশন

রৈখিক মডেলের জন্য ক্ষতি ফাংশন সর্বদা একটি উত্তল পৃষ্ঠ তৈরি করে। এই বৈশিষ্ট্যের ফলস্বরূপ, যখন একটি রৈখিক রিগ্রেশন মডেল একত্রিত হয়, তখন আমরা জানি যে মডেলটি সর্বনিম্ন ক্ষতির জন্য ওজন এবং পক্ষপাত খুঁজে পেয়েছে।

যদি আমরা একটি বৈশিষ্ট্যযুক্ত মডেলের জন্য ক্ষতি পৃষ্ঠের গ্রাফ আঁকি, তাহলে আমরা এর উত্তল আকৃতি দেখতে পাব। প্রতি গ্যালন ডেটাসেটে একটি কাল্পনিক মাইলের ক্ষতি পৃষ্ঠটি নিম্নরূপ। ওজন x-অক্ষে, পক্ষপাত y-অক্ষে এবং ক্ষতি z-অক্ষে:

চিত্র ১৬। ক্ষতি পৃষ্ঠের ত্রিমাত্রিক গ্রাফ।

চিত্র ১৬। ক্ষয় পৃষ্ঠ যা তার উত্তল আকৃতি দেখায়।

এই উদাহরণে, -৫.৪৪ ওজন এবং ৩৫.৯৪ বায়াস সর্বনিম্ন ৫.৫৪ ক্ষতির কারণ হয়:

চিত্র ১৭। ক্ষয় পৃষ্ঠের ত্রিমাত্রিক গ্রাফ, যার নীচে (-৫.৪৪, ৩৫.৯৪, ৫.৫৪) রয়েছে।

চিত্র ১৭। সর্বনিম্ন ক্ষতির কারণ হিসেবে ওজন এবং পক্ষপাতের মান দেখানো ক্ষতির পৃষ্ঠ।

একটি রৈখিক মডেল তখনই একত্রিত হয় যখন এটি সর্বনিম্ন ক্ষতি খুঁজে পায়। যদি আমরা গ্রেডিয়েন্ট অবতরণের সময় ওজন এবং পক্ষপাত বিন্দুগুলি গ্রাফ করি, তাহলে বিন্দুগুলি পাহাড়ের নিচে গড়িয়ে পড়া বলের মতো দেখাবে, অবশেষে এমন একটি বিন্দুতে থেমে যাবে যেখানে আর কোন নিম্নমুখী ঢাল নেই।

চিত্র ১৮। উত্তল ত্রিমাত্রিক ক্ষতি পৃষ্ঠ, যার গ্রেডিয়েন্ট অবতরণ বিন্দু সর্বনিম্ন বিন্দুতে চলে যাচ্ছে।

চিত্র ১৮। লোস গ্রাফে গ্রাফের সর্বনিম্ন বিন্দুতে থেমে থাকা গ্রেডিয়েন্ট ডিসেন্ট পয়েন্ট দেখানো হয়েছে।

লক্ষ্য করুন যে কালো ক্ষতির বিন্দুগুলি ক্ষতির বক্ররেখার সঠিক আকৃতি তৈরি করে: ধীরে ধীরে ঢালু হওয়ার আগে একটি খাড়া পতন, যতক্ষণ না তারা ক্ষতির পৃষ্ঠের সর্বনিম্ন বিন্দুতে পৌঁছায়।

ওজন এবং পক্ষপাতের মান ব্যবহার করে যা সর্বনিম্ন ক্ষতি করে - এই ক্ষেত্রে -৫.৪৪ ওজন এবং ৩৫.৯৪ পক্ষপাত - আমরা মডেলটি গ্রাফ করতে পারি যাতে দেখা যায় যে এটি ডেটার সাথে কতটা ভালভাবে খাপ খায়:

চিত্র ১৯। ১০০০ সেকেন্ডে পাউন্ড বনাম মাইল প্রতি গ্যালনের গ্রাফ, মডেলটি ডেটার সাথে মানানসই।

চিত্র ১৯। ওজন এবং পক্ষপাতের মান ব্যবহার করে মডেলটি গ্রাফ করা হয়েছে যা সর্বনিম্ন ক্ষতি করে।

এই ডেটাসেটের জন্য এটিই সেরা মডেল হবে কারণ অন্য কোনও ওজন এবং পক্ষপাতের মান কম ক্ষতি সহ একটি মডেল তৈরি করে না।