ওভারক্রসিং?
আপনি ভিডিওটি দেখার আগে বা ডকুমেন্টেশন পড়ার আগে, অনুগ্রহ করে এই অনুশীলনটি সম্পূর্ণ করুন যা বৈশিষ্ট্য ক্রসের অত্যধিক ব্যবহার অন্বেষণ করে।
টাস্ক 1: প্রদত্ত সমস্ত ক্রস-প্রোডাক্ট বৈশিষ্ট্য সহ মডেলটি যেমন আছে তেমন চালান। মডেলটি যেভাবে ডেটার সাথে খাপ খায় তাতে কি কোন আশ্চর্য আছে? সমস্যা কি?
টাস্ক 2: কর্মক্ষমতা উন্নত করতে বিভিন্ন ক্রস-প্রোডাক্ট বৈশিষ্ট্যগুলি সরানোর চেষ্টা করুন (যদিও সামান্য)। কেন বৈশিষ্ট্যগুলি সরানো কর্মক্ষমতা উন্নত করবে?
(উত্তরগুলি অনুশীলনের ঠিক নীচে প্রদর্শিত হবে।)
টাস্ক 1 এর উত্তরের জন্য প্লাস আইকনে ক্লিক করুন।
আশ্চর্যজনকভাবে, মডেলের সিদ্ধান্তের সীমানাটি একধরনের বিশ্রী দেখাচ্ছে। বিশেষ করে, উপরের বাম দিকে এমন একটি অঞ্চল রয়েছে যা নীলের দিকে ইঙ্গিত করছে, যদিও ডেটাতে এটির জন্য কোনও দৃশ্যমান সমর্থন নেই।
INPUT থেকে OUTPUT পর্যন্ত চলমান পাঁচটি লাইনের আপেক্ষিক পুরুত্ব লক্ষ্য করুন। এই লাইনগুলি পাঁচটি বৈশিষ্ট্যের আপেক্ষিক ওজন দেখায়। X 1 এবং X 2 থেকে নির্গত লাইনগুলি বৈশিষ্ট্য ক্রস থেকে আসা লাইনগুলির তুলনায় অনেক বেশি পুরু। সুতরাং, বৈশিষ্ট্য ক্রসগুলি সাধারণ (আনক্রসড) বৈশিষ্ট্যগুলির তুলনায় মডেলটিতে অনেক কম অবদান রাখছে।
টাস্ক 2-এর উত্তরের জন্য প্লাস আইকনে ক্লিক করুন।
সমস্ত বৈশিষ্ট্য ক্রস অপসারণ একটি আরও যুক্তিসঙ্গত মডেল দেয় (অতিরিক্ত ফিটিং এর পরামর্শমূলক বাঁকা সীমানা আর নেই) এবং পরীক্ষার ক্ষতি একত্রিত করে।
1,000 পুনরাবৃত্তির পরে, ফিচার ক্রস চালু হওয়ার তুলনায় পরীক্ষার ক্ষতি কিছুটা কম হওয়া উচিত (যদিও ডেটা সেটের উপর নির্ভর করে আপনার ফলাফল কিছুটা পরিবর্তিত হতে পারে)।
এই অনুশীলনের ডেটা মূলত লিনিয়ার ডেটা প্লাস নয়েজ। যদি আমরা এমন একটি মডেল ব্যবহার করি যা খুব জটিল, যেমন অনেকগুলি ক্রস সহ একটি, আমরা এটিকে প্রশিক্ষণের ডেটাতে গোলমালের সাথে মানানসই করার সুযোগ দিই, প্রায়শই মডেলটিকে পরীক্ষার ডেটাতে খারাপভাবে পারফর্ম করার খরচে।