আপনার বোঝাপড়া পরীক্ষা করুন: মডেল ডিবাগিং

নিম্নলিখিত প্রশ্নের জন্য, প্রসারিত করতে এবং আপনার উত্তর পরীক্ষা করতে আপনার নির্বাচনের উপর ক্লিক করুন।

মডেলিং পদ্ধতি

আপনি এবং আপনার বন্ধু মেল ইউনিকর্নের মতো। আসলে, আপনি ইউনিকর্নকে অনেক পছন্দ করেন, আপনি ... মেশিন লার্নিং ব্যবহার করে ইউনিকর্নের উপস্থিতির পূর্বাভাস দেওয়ার সিদ্ধান্ত নেন। আপনার কাছে 10,000 ইউনিকর্নের উপস্থিতির একটি ডেটাসেট আছে। প্রতিটি উপস্থিতির জন্য, ডেটাসেটে অবস্থান, দিনের সময়, উচ্চতা, তাপমাত্রা, আর্দ্রতা, জনসংখ্যার ঘনত্ব, গাছের আবরণ, একটি রংধনুর উপস্থিতি এবং অন্যান্য অনেক বৈশিষ্ট্য রয়েছে।

আপনি আপনার ML মডেল উন্নয়ন শুরু করতে চান. নিম্নলিখিত পন্থাগুলির মধ্যে কোনটি উন্নয়ন শুরু করার একটি ভাল উপায়?
ইউনিকর্ন প্রায়শই ভোর এবং সন্ধ্যায় দেখা যায়। অতএব, একটি লিনিয়ার মডেল তৈরি করতে "দিনের সময়" বৈশিষ্ট্যটি ব্যবহার করুন।
সঠিক। একটি রৈখিক মডেল যা এক বা দুটি উচ্চ-ভবিষ্যদ্বাণীমূলক বৈশিষ্ট্য ব্যবহার করে শুরু করার একটি কার্যকর উপায়।
ইউনিকর্নের উপস্থিতি ভবিষ্যদ্বাণী করা একটি খুব কঠিন সমস্যা। অতএব, সমস্ত উপলব্ধ বৈশিষ্ট্য সহ একটি গভীর নিউরাল নেটওয়ার্ক ব্যবহার করুন।
ত্রুটিপূর্ণ. একটি জটিল মডেল দিয়ে শুরু করা ডিবাগিংকে জটিল করবে।
একটি সাধারণ রৈখিক মডেল দিয়ে শুরু করুন কিন্তু সাধারণ মডেলের ভবিষ্যদ্বাণী করার ক্ষমতা আছে তা নিশ্চিত করতে সমস্ত বৈশিষ্ট্য ব্যবহার করুন।
ত্রুটিপূর্ণ. আপনি যদি অনেকগুলি বৈশিষ্ট্য ব্যবহার করেন, এমনকি একটি রৈখিক মডেলের সাথেও, তাহলে ফলস্বরূপ মডেলটি জটিল এবং ডিবাগ করা কঠিন।

বেসলাইন

গড় স্কোয়ার এরর (MSE) ক্ষতি সহ রিগ্রেশন ব্যবহার করে, আপনি রাইডের সময়কাল, দূরত্ব, উত্স এবং শেষ ব্যবহার করে ট্যাক্সি যাত্রার খরচের পূর্বাভাস দিচ্ছেন। তুমি জান:

  • গড় যাত্রা খরচ $15.
  • রাইড খরচ প্রতি কিলোমিটারে একটি নির্দিষ্ট পরিমাণ বৃদ্ধি পায়।
  • শহরের কেন্দ্রস্থল এলাকায় রাইড অতিরিক্ত চার্জ করা হয়.
  • রাইডগুলি সর্বনিম্ন $3 থেকে শুরু হয়।

নিম্নলিখিত বেসলাইনগুলি কার্যকর কিনা তা নির্ধারণ করুন।

এটি কি একটি দরকারী বেসলাইন: প্রতিটি যাত্রার মূল্য $15।
হ্যাঁ
সঠিক। গড় খরচ একটি দরকারী বেসলাইন.
না
ত্রুটিপূর্ণ. সর্বদা অন্য কোনো মান ভবিষ্যদ্বাণী করার চেয়ে কম MSE-এ গড় ফলাফলের পূর্বাভাস দেওয়া। অতএব, এই বেসলাইনের বিরুদ্ধে একটি মডেল পরীক্ষা করা একটি অর্থপূর্ণ তুলনা প্রদান করে।
এটা নির্ভর করে রাইড খরচের স্ট্যান্ডার্ড বিচ্যুতি কত তার উপর।
ত্রুটিপূর্ণ. প্রমিত বিচ্যুতি নির্বিশেষে, রাইডের গড় খরচ একটি দরকারী বেসলাইন কারণ সর্বদা অন্য কোনো মানের পূর্বাভাস দেওয়ার তুলনায় সর্বদা নিম্ন MSE-এ গড় ফলাফলের পূর্বাভাস দেওয়া হয়।
এটি কি একটি দরকারী বেসলাইন: একটি প্রশিক্ষিত মডেল যা বৈশিষ্ট্য হিসাবে শুধুমাত্র সময়কাল এবং উত্স ব্যবহার করে৷
হ্যাঁ
ত্রুটিপূর্ণ. আপনি শুধুমাত্র একটি প্রশিক্ষিত মডেল একটি বেসলাইন হিসাবে ব্যবহার করা উচিত যখন মডেল সম্পূর্ণরূপে উত্পাদন বৈধ করা হয়. উপরন্তু, প্রশিক্ষিত মডেল নিজেই একটি সহজ বেসলাইনের বিরুদ্ধে যাচাই করা উচিত।
না
সঠিক। আপনি শুধুমাত্র একটি প্রশিক্ষিত মডেল একটি বেসলাইন হিসাবে ব্যবহার করা উচিত যখন মডেল সম্পূর্ণরূপে উত্পাদন বৈধ করা হয়.
এটি কি একটি দরকারী বেসলাইন: একটি রাইডের খরচ হল রাইডের দূরত্ব (কিলোমিটারে) প্রতি কিলোমিটারের ভাড়া দ্বারা গুণিত৷
হ্যাঁ
সঠিক। রাইড খরচ নির্ধারণে দূরত্ব সবচেয়ে গুরুত্বপূর্ণ বিষয়। অতএব, একটি বেসলাইন যা দূরত্বের উপর নির্ভর করে দরকারী।
না
ত্রুটিপূর্ণ. রাইড খরচ নির্ধারণের ক্ষেত্রে দূরত্ব সবচেয়ে গুরুত্বপূর্ণ বিষয়। অতএব, একটি বেসলাইন যা দূরত্বের উপর নির্ভর করে দরকারী।
এটি কি একটি দরকারী বেসলাইন: প্রতিটি যাত্রার দাম $1। কারণ মডেল সবসময় এই বেসলাইন বীট করা আবশ্যক. যদি মডেলটি এই বেসলাইনটি বীট না করে, তাহলে আমরা নিশ্চিত হতে পারি যে মডেলটিতে একটি বাগ আছে।
হ্যাঁ
ত্রুটিপূর্ণ. এটি একটি দরকারী বেসলাইন নয় কারণ এটি সর্বদা ভুল। একটি বেসলাইনের সাথে একটি মডেল তুলনা করা যা সর্বদা ভুল হয় তা অর্থপূর্ণ নয়।
না
সঠিক। এই বেসলাইন আপনার মডেলের একটি দরকারী পরীক্ষা নয়.

হাইপারপ্যারামিটার

নিম্নলিখিত প্রশ্নগুলি ক্লাসিফায়ারকে প্রশিক্ষণ দেওয়ার ক্ষেত্রে সমস্যাগুলি বর্ণনা করে। বর্ণনা করা সমস্যার সমাধান করতে পারে এমন কর্মগুলি বেছে নিন।

প্রশিক্ষণের ক্ষতি 0.24 এবং বৈধতা ক্ষতি 0.36। নিচের কোন দুটি কর্ম প্রশিক্ষণ এবং বৈধতা ক্ষতির মধ্যে পার্থক্য কমাতে পারে?
নিশ্চিত করুন যে প্রশিক্ষণ এবং বৈধতা সেটের একই পরিসংখ্যানগত বৈশিষ্ট্য রয়েছে।
সঠিক। যদি প্রশিক্ষণ এবং বৈধতা সেটের বিভিন্ন পরিসংখ্যানগত বৈশিষ্ট্য থাকে, তাহলে প্রশিক্ষণের ডেটা যাচাইকরণ ডেটার পূর্বাভাস দিতে সাহায্য করবে না।
অতিরিক্ত ফিটিং প্রতিরোধ করতে নিয়মিতকরণ ব্যবহার করুন।
সঠিক। যদি প্রশিক্ষণের ক্ষতি বৈধকরণের ক্ষতির চেয়ে ছোট হয়, তাহলে আপনার মডেলটি সম্ভবত প্রশিক্ষণের ডেটার সাথে ওভারফিটিং করছে। নিয়মিতকরণ ওভারফিটিং প্রতিরোধ করে।
প্রশিক্ষণ যুগের সংখ্যা বাড়ান।
ত্রুটিপূর্ণ. যদি প্রশিক্ষণের ক্ষতি বৈধকরণের ক্ষতির চেয়ে ছোট হয়, তাহলে আপনার মডেলটি সাধারণত প্রশিক্ষণের ডেটার সাথে ওভারফিটিং হয়। ক্রমবর্ধমান প্রশিক্ষণ যুগ শুধুমাত্র overfitting বৃদ্ধি হবে.
শেখার হার কমিয়ে দিন।
ত্রুটিপূর্ণ. প্রশিক্ষণের ক্ষতির চেয়ে একটি বৈধতা ক্ষতি হওয়া সাধারণত অতিরিক্ত ফিটিং নির্দেশ করে। শেখার হার পরিবর্তন করা ওভারফিটিং হ্রাস করে না।
আপনি পূর্ববর্তী প্রশ্নে বর্ণিত সঠিক ক্রিয়াগুলি সম্পাদন করেছেন এবং এখন অনেক যুগের প্রশিক্ষণের পরে আপনার প্রশিক্ষণ এবং বৈধতা ক্ষতি 1.0 থেকে প্রায় 0.24-এ নেমে এসেছে। নিচের কোন কাজটি আপনার প্রশিক্ষণের ক্ষতি আরও কমাতে পারে?
আপনার নিউরাল নেটওয়ার্কের গভীরতা এবং প্রস্থ বাড়ান।
সঠিক। অনেক যুগের জন্য প্রশিক্ষণের পর যদি আপনার প্রশিক্ষণের ক্ষতি 0.24-এ স্থির থাকে, তাহলে আপনার মডেলের ক্ষতি আরও কম করার ভবিষ্যদ্বাণী করার ক্ষমতার অভাব হতে পারে। মডেলের গভীরতা এবং প্রস্থ বাড়ানো মডেলটিকে প্রশিক্ষণের ক্ষতি আরও কমাতে প্রয়োজনীয় অতিরিক্ত ভবিষ্যদ্বাণী করার ক্ষমতা দিতে পারে।
প্রশিক্ষণ যুগের সংখ্যা বাড়ান।
ত্রুটিপূর্ণ. অনেক যুগের প্রশিক্ষণের পর যদি আপনার প্রশিক্ষণের ক্ষতি 0.24-এ থেকে যায়, তাহলে মডেলটি প্রশিক্ষণ চালিয়ে যাওয়ার ফলে প্রশিক্ষণের ক্ষতি উল্লেখযোগ্যভাবে হ্রাস পাবে না।
শেখার হার বৃদ্ধি।
ত্রুটিপূর্ণ. প্রদত্ত যে অনেক প্রশিক্ষণ যুগের জন্য প্রশিক্ষণের ক্ষতি হ্রাস পায়নি, শেখার হার বৃদ্ধি সম্ভবত চূড়ান্ত প্রশিক্ষণের ক্ষতি কম করবে না। পরিবর্তে, শেখার হার বৃদ্ধি আপনার প্রশিক্ষণকে অস্থির করে তুলতে পারে এবং আপনার মডেলটিকে ডেটা শেখা থেকে বাধা দিতে পারে।
আপনি আগের প্রশ্নে সঠিক পদক্ষেপ নিন। আপনার মডেলের প্রশিক্ষণের ক্ষতি 0.20 এ কমে গেছে। ধরে নিন আপনার মডেলের প্রশিক্ষণের ক্ষতি একটু বেশি কমাতে হবে। আপনি কিছু বৈশিষ্ট্য যোগ করুন যা ভবিষ্যদ্বাণী করার ক্ষমতা আছে বলে মনে হচ্ছে। যাইহোক, প্রশিক্ষণের ক্ষতি 0.20 এর কাছাকাছি ওঠানামা করতে থাকে। নিচের কোন তিনটি বিকল্প আপনার প্রশিক্ষণের ক্ষতি কমাতে পারে?
আপনার স্তরগুলির গভীরতা এবং প্রস্থ বাড়ান।
সঠিক। আপনার মডেলের নতুন বৈশিষ্ট্যে ভবিষ্যদ্বাণীমূলক সংকেত শেখার ক্ষমতার অভাব হতে পারে।
প্রশিক্ষণের যুগ বাড়ান।
ত্রুটিপূর্ণ. যদি আপনার মডেলের প্রশিক্ষণের ক্ষতি 0.20-এর আশেপাশে ওঠানামা করে, তাহলে প্রশিক্ষণ যুগের সংখ্যা বাড়ানোর ফলে মডেলের প্রশিক্ষণের ক্ষতি 0.20-এর কাছাকাছি চলতে থাকবে।
বৈশিষ্ট্যগুলি বিদ্যমান বৈশিষ্ট্যগুলির সাথে সম্পর্কিত তথ্য যোগ করে না। একটি ভিন্ন বৈশিষ্ট্য চেষ্টা করুন.
সঠিক। এটা সম্ভব যে বৈশিষ্ট্যগুলি দ্বারা এনকোড করা ভবিষ্যদ্বাণীমূলক সংকেতগুলি আপনি যে বৈশিষ্ট্যগুলি ব্যবহার করছেন তাতে ইতিমধ্যেই বিদ্যমান৷
শেখার হার কমিয়ে দিন।
সঠিক। এটা সম্ভব যে নতুন বৈশিষ্ট্য যোগ করা সমস্যাটিকে আরও জটিল করে তুলেছে। বিশেষত, ক্ষতির ওঠানামা ইঙ্গিত দেয় যে শেখার হার খুব বেশি এবং আপনার মডেলটি মিনিমাতে ঝাঁপিয়ে পড়ছে। আপনার শেখার হার কমানো আপনার মডেলকে মিনিমাম শিখতে দেবে।