ওভারফিটিং: ক্ষতি বক্ররেখা ব্যাখ্যা করা

মেশিন লার্নিং অনেক সহজ হবে যদি আপনি প্রথমবার আপনার মডেলকে প্রশিক্ষণ দেওয়ার সময় আপনার সমস্ত ক্ষতির বক্ররেখা এইরকম দেখায়:

চিত্র 20. প্রশিক্ষণের সময় আদর্শ ক্ষতির বক্ররেখা দেখানো একটি প্লট a             মেশিন লার্নিং মডেল। লস বক্ররেখা y-অক্ষে ক্ষতি প্লট করে             x-অক্ষে প্রশিক্ষণের ধাপের সংখ্যার বিপরীতে। সংখ্যা হিসাবে             প্রশিক্ষণের ধাপগুলি বৃদ্ধি পায়, ক্ষতি বেশি শুরু হয়, তারপরে হ্রাস পায়             exponentially, এবং পরিণামে একটি ন্যূনতম পৌঁছানোর আউট সমতল             ক্ষতি
চিত্র 20. একটি আদর্শ ক্ষতি বক্ররেখা।

দুর্ভাগ্যবশত, ক্ষতি বক্ররেখা প্রায়ই ব্যাখ্যা করা চ্যালেঞ্জিং হয়. এই পৃষ্ঠায় ব্যায়াম সমাধান করতে ক্ষতি বক্ররেখা সম্পর্কে আপনার অন্তর্দৃষ্টি ব্যবহার করুন.

ব্যায়াম 1: দোদুল্যমান ক্ষতি বক্ররেখা

চিত্র 21. একটি ক্ষতি বক্ররেখা (y-অক্ষে ক্ষতি; প্রশিক্ষণের সংখ্যা             x-অক্ষের ধাপ) যাতে ক্ষতি সমতল হয় না।             পরিবর্তে, ক্ষতি অনিয়মিতভাবে oscillates.
চিত্র 21. দোদুল্যমান ক্ষতি বক্ররেখা।
চিত্র 21-এ দেখানো ক্ষতির বক্ররেখা উন্নত করার জন্য আপনি কী তিনটি জিনিস করতে পারেন?
খারাপ উদাহরণ সনাক্ত করতে একটি ডেটা স্কিমার বিরুদ্ধে আপনার ডেটা পরীক্ষা করুন এবং তারপর প্রশিক্ষণ সেট থেকে খারাপ উদাহরণগুলি সরিয়ে দিন।
হ্যাঁ, এটি সমস্ত মডেলের জন্য একটি ভাল অনুশীলন।
শেখার হার কমিয়ে দিন।
হ্যাঁ, প্রশিক্ষণের সমস্যা ডিবাগ করার সময় শেখার হার হ্রাস করা প্রায়শই একটি ভাল ধারণা।
অল্প সংখ্যক বিশ্বস্ত উদাহরণে প্রশিক্ষণ সেট কমিয়ে দিন।
যদিও এই কৌশলটি কৃত্রিম মনে হয়, এটি আসলে একটি ভাল ধারণা। অনুমান করে যে মডেলটি বিশ্বাসযোগ্য উদাহরণের ছোট সেটে একত্রিত হয়, আপনি ধীরে ধীরে আরও উদাহরণ যোগ করতে পারেন, সম্ভবত কোন উদাহরণগুলি ক্ষতির বক্ররেখাকে দোদুল্যমান করে তা আবিষ্কার করতে পারেন।
প্রশিক্ষণ সেটে উদাহরণের সংখ্যা বাড়ান।
এটি একটি প্রলোভনসঙ্কুল ধারণা, কিন্তু এটি সমস্যার সমাধান করার সম্ভাবনা খুবই কম।
শেখার হার বাড়ান।
সাধারণভাবে, যখন কোনো মডেলের শেখার বক্ররেখা কোনো সমস্যা নির্দেশ করে তখন শেখার হার বাড়ানো এড়িয়ে চলুন।

ব্যায়াম 2. একটি ধারালো লাফ দিয়ে ক্ষতি বক্ররেখা

চিত্র 22. একটি ক্ষতি বক্ররেখা প্লট যা দেখায় যে ক্ষতি a পর্যন্ত হ্রাস পাচ্ছে             প্রশিক্ষণের নির্দিষ্ট সংখ্যক ধাপ এবং তারপরে হঠাৎ করে বৃদ্ধি             আরও প্রশিক্ষণের ধাপ সহ।
চিত্র 22. ক্ষতির তীব্র বৃদ্ধি।
নিচের কোন দুটি বিবৃতি চিত্র 22-এ দেখানো বিস্ফোরিত ক্ষতির সম্ভাব্য কারণ চিহ্নিত করে?
ইনপুট ডেটাতে এক বা একাধিক NaN থাকে—উদাহরণস্বরূপ, শূন্য দ্বারা বিভাজনের কারণে একটি মান।
এটি আপনার প্রত্যাশার চেয়ে বেশি সাধারণ।
ইনপুট ডেটাতে আউটলায়ারগুলির একটি বিস্ফোরণ রয়েছে৷
কখনও কখনও, ব্যাচগুলির অনুপযুক্ত পরিবর্তনের কারণে, একটি ব্যাচে প্রচুর আউটলায়ার থাকতে পারে।
শেখার হার খুবই কম।
খুব কম শেখার হার প্রশিক্ষণের সময় বাড়াতে পারে, কিন্তু এটি অদ্ভুত ক্ষতির বক্ররেখার কারণ নয়।
নিয়মিতকরণের হার খুব বেশি।
সত্য, একটি খুব উচ্চ নিয়মিতকরণ একটি মডেলকে একত্রিত হতে বাধা দিতে পারে; যাইহোক, এটি চিত্র 22-এ দেখানো অদ্ভুত ক্ষতির বক্ররেখা সৃষ্টি করবে না।

অনুশীলন 3. পরীক্ষার ক্ষতি প্রশিক্ষণের ক্ষতি থেকে বিচ্ছিন্ন হয়

চিত্র 23. প্রশিক্ষণ ক্ষতি বক্ররেখা একত্রিত হতে দেখা যায়, কিন্তু             একটি নির্দিষ্ট সংখ্যক প্রশিক্ষণের পরে বৈধতা ক্ষতি বাড়তে শুরু করে             পদক্ষেপ
চিত্র 23. বৈধতা ক্ষতির তীব্র বৃদ্ধি।
নিচের কোন বিবৃতিটি প্রশিক্ষণ এবং পরীক্ষার সেটের ক্ষতির বক্ররেখার মধ্যে এই পার্থক্যের কারণটি সবচেয়ে ভালোভাবে চিহ্নিত করে?
মডেল প্রশিক্ষণ সেট overfitting হয়.
হ্যাঁ, এটা সম্ভবত. সম্ভাব্য সমাধান:
  • মডেলটিকে সহজ করুন, সম্ভবত বৈশিষ্ট্যের সংখ্যা হ্রাস করে৷
  • নিয়মিতকরণের হার বাড়ান।
  • নিশ্চিত করুন যে প্রশিক্ষণ সেট এবং পরীক্ষার সেট পরিসংখ্যানগতভাবে সমতুল্য।
শেখার হার খুব বেশি।
শেখার হার খুব বেশি হলে, প্রশিক্ষণ সেটের ক্ষতির বক্ররেখা সম্ভবত এটির মতো আচরণ করত না।

ব্যায়াম 4. ক্ষতির বক্ররেখা আটকে যায়

চিত্র 24. ক্ষতির বক্ররেখার একটি প্লট যা ক্ষতির শুরু দেখাচ্ছে             প্রশিক্ষণের সাথে একত্রিত হন কিন্তু তারপরে বারবার নিদর্শনগুলি প্রদর্শন করে যা             একটি আয়তক্ষেত্রাকার তরঙ্গ মত চেহারা.
চিত্র 24. একটি নির্দিষ্ট সংখ্যক ধাপের পরে বিশৃঙ্খল ক্ষতি।
চিত্র 24-এ দেখানো অনিয়মিত ক্ষতি বক্ররেখার জন্য নিম্নলিখিত বিবৃতিগুলির মধ্যে কোনটি সম্ভাব্য ব্যাখ্যা?
প্রশিক্ষণ সেট ভাল এলোমেলো হয় না.
এটি একটি সম্ভাবনা। উদাহরণ স্বরূপ, একটি প্রশিক্ষণ সেট যাতে কুকুরের 100টি ছবি এবং বিড়ালের 100টি ছবি থাকে তা মডেল ট্রেনের সাথে সাথে দোদুল্যমান ক্ষতির কারণ হতে পারে। আপনি যথেষ্ট উদাহরণ এলোমেলো করা নিশ্চিত করুন.
নিয়মিতকরণের হার খুব বেশি।
এই কারণ হতে অসম্ভাব্য.
প্রশিক্ষণ সেটে অনেকগুলি বৈশিষ্ট্য রয়েছে৷
এই কারণ হতে অসম্ভাব্য.