নীচের বিকল্পগুলি অন্বেষণ করুন.

দুটি দৃঢ়ভাবে সম্পর্কযুক্ত বৈশিষ্ট্য সহ একটি রৈখিক মডেল কল্পনা করুন; অর্থাৎ, এই দুটি বৈশিষ্ট্য একে অপরের প্রায় অভিন্ন অনুলিপি কিন্তু একটি বৈশিষ্ট্যে অল্প পরিমাণ এলোমেলো শব্দ রয়েছে। যদি আমরা এই মডেলটিকে L 2 নিয়মিতকরণের সাথে প্রশিক্ষণ দিই, তাহলে এই দুটি বৈশিষ্ট্যের ওজনের কী হবে?
উভয় বৈশিষ্ট্যই মোটামুটি সমান, মাঝারি ওজন থাকবে।
L 2 নিয়মিতকরণ বৈশিষ্ট্যগুলিকে মোটামুটি সমতুল্য ওজনের দিকে বাধ্য করবে যা মডেলটিতে দুটি বৈশিষ্ট্যের মধ্যে কেবল একটি থাকলে তারা যা হত তার প্রায় অর্ধেক।
একটি বৈশিষ্ট্য একটি বড় ওজন থাকবে; অন্যটির ওজন প্রায় 0.0 হবে।
L 2 নিয়মিতকরণ ছোট ওজনের চেয়ে বড় ওজনকে শাস্তি দেয়। সুতরাং, এমনকি যদি একটি ওজন অন্যটির তুলনায় দ্রুত কমতে শুরু করে, L 2 নিয়মিতকরণের ফলে বড় ওজনকে ছোট ওজনের চেয়ে দ্রুত কমতে বাধ্য করা হবে।
একটি বৈশিষ্ট্য একটি বড় ওজন থাকবে; অন্যটির ওজন ঠিক 0.0 হবে।
L 2 নিয়মিতকরণ খুব কমই ওজনকে ঠিক 0.0-তে বাধ্য করে। বিপরীতে, L 1 নিয়মিতকরণ (পরে আলোচনা করা হয়েছে) ওজনকে ঠিক 0.0 করতে বাধ্য করে