প্রশিক্ষণ সেট এবং পরীক্ষার সেট
আমরা প্রশিক্ষণ সেট এবং পরীক্ষার সেট নিয়ে পরীক্ষা করার জন্য খেলার মাঠে ফিরে যাই।
কমলা এবং নীল বিন্দু বলতে কী বোঝায় তার অনুস্মারকের জন্য প্লাস আইকনে ক্লিক করুন।
ভিজ্যুয়ালাইজেশনে:
- প্রতিটি নীল বিন্দু এক শ্রেণীর ডেটার একটি উদাহরণ নির্দেশ করে (উদাহরণস্বরূপ, স্প্যাম)।
- প্রতিটি কমলা বিন্দু অন্য শ্রেণীর ডেটার একটি উদাহরণ নির্দেশ করে (উদাহরণস্বরূপ, স্প্যাম নয়)।
- পটভূমির রঙটি মডেলের ভবিষ্যদ্বাণীকে উপস্থাপন করে যেখানে সেই রঙের উদাহরণগুলি পাওয়া উচিত। একটি নীল বিন্দুর চারপাশে একটি নীল পটভূমির অর্থ হল মডেলটি সেই উদাহরণটি সঠিকভাবে ভবিষ্যদ্বাণী করছে৷ বিপরীতভাবে, একটি নীল বিন্দুর চারপাশে একটি কমলা পটভূমির অর্থ হল মডেলটি সেই উদাহরণের জন্য একটি ভুল ভবিষ্যদ্বাণী করছে।
এই অনুশীলনটি একটি পরীক্ষা সেট এবং একটি প্রশিক্ষণ সেট উভয়ই প্রদান করে, উভয়ই একই ডেটা সেট থেকে আঁকা। ডিফল্টরূপে, ভিজ্যুয়ালাইজেশন শুধুমাত্র প্রশিক্ষণ সেট দেখায়। আপনি যদি পরীক্ষার সেটটিও দেখতে চান, তাহলে ভিজ্যুয়ালাইজেশনের ঠিক নীচে টেস্ট ডেটা দেখান চেকবক্সে ক্লিক করুন। ভিজ্যুয়ালাইজেশনে, নিম্নলিখিত পার্থক্যটি নোট করুন:
- প্রশিক্ষণ উদাহরণ একটি সাদা রূপরেখা আছে.
- পরীক্ষার উদাহরণগুলির একটি কালো রূপরেখা রয়েছে।
টাস্ক 1: নিম্নলিখিতটি করে প্রদত্ত সেটিংস সহ খেলার মাঠ চালান:
- রান/পজ বোতামে ক্লিক করুন:
- পরীক্ষা ক্ষতি এবং প্রশিক্ষণ ক্ষতি মান পরিবর্তন দেখুন.
- যখন টেস্ট ক্ষতি এবং প্রশিক্ষণের ক্ষতির মানগুলি পরিবর্তন করা বন্ধ হয়ে যায় বা কিছুক্ষণের মধ্যে শুধুমাত্র একবার পরিবর্তন হয়, খেলার মাঠে বিরাম দিতে আবার রান/পজ বোতাম টিপুন।
টেস্ট হার এবং ট্রেনিং হারের মধ্যে ডেল্টা নোট করুন। আমরা নিম্নলিখিত কাজগুলিতে এই ডেল্টা কমানোর চেষ্টা করব।
কাজ 2: নিম্নলিখিতগুলি করুন:
- রিসেট বোতাম টিপুন।
- শেখার হার পরিবর্তন করুন।
- রান/পজ বোতাম টিপুন:
- খেলার মাঠকে অন্তত 150টি যুগ চলতে দিন।
এই নতুন শেখার হারের সাথে টেস্ট ক্ষতি এবং প্রশিক্ষণের ক্ষতির মধ্যে ডেল্টা কি কম বা বেশি? আপনি শেখার হার এবং ব্যাচ আকার উভয় পরিবর্তন করলে কি হবে?
ঐচ্ছিক টাস্ক 3: প্রশিক্ষণ ডেটা শতাংশ লেবেলযুক্ত একটি স্লাইডার আপনাকে ডেটা পরীক্ষা করার জন্য প্রশিক্ষণ ডেটার অনুপাত নিয়ন্ত্রণ করতে দেয়। উদাহরণস্বরূপ, যখন 90% সেট করা হয়, তখন 90% ডেটা প্রশিক্ষণ সেটের জন্য ব্যবহৃত হয় এবং অবশিষ্ট 10% পরীক্ষা সেটের জন্য ব্যবহৃত হয়।
নিম্নলিখিতগুলি করুন:
- "প্রশিক্ষণ ডেটা শতাংশ" 50% থেকে কমিয়ে 10% করুন৷
- শেখার হার এবং ব্যাচের আকার নিয়ে পরীক্ষা করুন, আপনার ফলাফলের উপর নোট নিন।
প্রশিক্ষণ ডেটা শতাংশ পরিবর্তন করা কি সর্বোত্তম শেখার সেটিংস পরিবর্তন করে যা আপনি টাস্ক 2 এ আবিষ্কার করেছেন? যদি তাই হয়, কেন?
টাস্ক 1 এর উত্তরের জন্য প্লাস আইকনে ক্লিক করুন।
শেখার হার 3 (প্রাথমিক সেটিং) এ সেট করা হলে, পরীক্ষার ক্ষতি প্রশিক্ষণের ক্ষতির চেয়ে উল্লেখযোগ্যভাবে বেশি।
টাস্ক 2 এর উত্তরের জন্য প্লাস আইকনে ক্লিক করুন।
শেখার হার হ্রাস করে (উদাহরণস্বরূপ, 0.001 পর্যন্ত), পরীক্ষার ক্ষতি প্রশিক্ষণের ক্ষতির অনেক কাছাকাছি একটি মানতে নেমে আসে। বেশির ভাগ রানের ক্ষেত্রে, ব্যাচের আকার বৃদ্ধি করা প্রশিক্ষণের ক্ষতি বা টেস্ট ক্ষতিকে উল্লেখযোগ্যভাবে প্রভাবিত করে না। যাইহোক, রানের একটি ছোট শতাংশে, ব্যাচের আকার 20 বা তার বেশি বাড়ালে টেস্ট লস ট্রেনিং লস থেকে কিছুটা নিচে নেমে যায়।
খেলার মাঠের ডেটা সেটগুলি এলোমেলোভাবে তৈরি হয়। ফলস্বরূপ, আমাদের উত্তর সবসময় আপনার সাথে একমত নাও হতে পারে।
টাস্ক 3 এর উত্তরের জন্য প্লাস আইকনে ক্লিক করুন।
প্রশিক্ষণ ডেটা শতাংশকে 50% থেকে 10% এ কমিয়ে নাটকীয়ভাবে প্রশিক্ষণ সেটে ডেটা পয়েন্টের সংখ্যা কমিয়ে দেয়। এত কম ডেটা সহ, উচ্চ ব্যাচের আকার এবং উচ্চ শিক্ষার হার প্রশিক্ষণের মডেলটিকে বিশৃঙ্খলভাবে চারপাশে লাফিয়ে দেয় (সর্বনিম্ন পয়েন্টের উপর বারবার লাফানো)।