ডেটাসেট, সাধারণীকরণ, এবং ওভারফিটিং,ডেটাসেট, সাধারণীকরণ এবং ওভারফিটিং

ভূমিকা

এই মডিউলটি একটি অগ্রণী প্রশ্ন দিয়ে শুরু হয়। নিম্নলিখিত উত্তরগুলির মধ্যে একটি চয়ন করুন:

আপনার মেশিন লার্নিং প্রকল্পে আপনাকে যদি নিম্নলিখিত ক্ষেত্রগুলির মধ্যে একটির উন্নতি করতে অগ্রাধিকার দিতে হয়, তাহলে কোনটি সবচেয়ে বেশি প্রভাব ফেলবে?
আপনার ডেটাসেটের গুণমান উন্নত করা
তথ্য সব tramps. আপনার মডেল তৈরি করতে আপনি কোন চকচকে অ্যালগরিদম ব্যবহার করেন তার চেয়ে ডেটাসেটের গুণমান এবং আকার অনেক বেশি গুরুত্বপূর্ণ৷
আপনার মডেলকে প্রশিক্ষণ দেওয়ার জন্য আরও চতুর ক্ষতির ফাংশন প্রয়োগ করা
সত্য, একটি ভাল ক্ষতি ফাংশন একটি মডেল ট্রেন দ্রুত সাহায্য করতে পারে, কিন্তু এটি এখনও এই তালিকার অন্য আইটেম একটি দূরবর্তী দ্বিতীয়.

এবং এখানে একটি আরও নেতৃস্থানীয় প্রশ্ন:

একটি অনুমান করুন: আপনার মেশিন লার্নিং প্রকল্পে, আপনি সাধারণত ডেটা প্রস্তুতি এবং রূপান্তরের জন্য কতটা সময় ব্যয় করেন?
প্রকল্পের সময় অর্ধেকের বেশি
হ্যাঁ, এমএল অনুশীলনকারীরা তাদের বেশিরভাগ সময় ডেটাসেট তৈরি করতে এবং ফিচার ইঞ্জিনিয়ারিং করতে ব্যয় করে।
প্রকল্পের সময়ের অর্ধেকেরও কম
আরো জন্য পরিকল্পনা! সাধারণত, মেশিন লার্নিং প্রকল্পের 80% সময় ডেটাসেট তৈরি করতে এবং ডেটা রূপান্তর করতে ব্যয় হয়।

এই মডিউলে, আপনি মেশিন লার্নিং ডেটাসেটের বৈশিষ্ট্য এবং আপনার মডেলকে প্রশিক্ষণ ও মূল্যায়ন করার সময় উচ্চ-মানের ফলাফল নিশ্চিত করতে কীভাবে আপনার ডেটা প্রস্তুত করবেন সে সম্পর্কে আরও শিখবেন।