التسوية من أجل الندرة: تحقق من فهمك

تسوية L1

اطّلِع على الخيارات أدناه.

تخيَّل نموذجًا خطيًا يتضمّن 100 ميزة إدخال:
  • 10 مفيدة للغاية.
  • و90 شركة لا تقدّم معلومات مفيدة.
  • لنفترض أن جميع الخصائص لها قيم بين -1 و1. أي من العبارات التالية صحيحة؟
    من خلال تسوية المستوى الأول، تكون قيمة العديد من القيم التقديرية غير الإعلامية تساوي 0.0 تقريبًا (وليس بالضبط).
    وبوجه عام، يميل تنظيم L1 الكافي لدالة lambda الكافية إلى تشجيع الميزات غير المفيدة على أوزان 0.0 بالضبط. على عكس التسوية في المستوى الثاني، "يدفع" التسوية L1 بقوة نحو 0.0 بغض النظر عن بُعد الوزن عن 0.0.
    من خلال ضبط المستوى الأول، تكون معظم القيم التقديرية غير الإعلامية 0.0 بالضبط.
    يؤدي تنظيم مستوى لامدا الكافي إلى تشجيع الأوزان غير المفيدة على أن تصبح 0.0 بالضبط. وبذلك، تخرج هذه الميزات غير المفيدة من النموذج.
    قد يؤدي تنظيم المستوى الأول إلى حصول الميزات الإعلامية على 0.0 بالضبط.
    كن حذرًا، فقد يؤدي تسوية L1 إلى منح الأنواع التالية من الميزات قيمة 0 بالضبط:
  • الميزات الإعلامية ضعيفة.
  • ميزات غنية بالمعلومات على نطاقات مختلفة
  • ميزات إعلامية ترتبط ارتباطًا وثيقًا بميزات أخرى إعلامية مشابهة
  • 1 في مقابل L2 التسوية

    اطّلِع على الخيارات أدناه.

    تخيَّل نموذجًا خطيًا يتضمّن 100 ميزة إدخال، وجميعها لها قيم بين -1 و1:
  • 10 مفيدة للغاية.
  • و90 شركة لا تقدّم معلومات مفيدة.
  • أي نوع من التسوية سينتج النموذج الأصغر؟
    L2 الضبط.
    نادرًا ما يؤدي تسوية 2 إلى تقليل عدد الميزات. وبعبارة أخرى، نادرًا ما تقلّل التسوية 2 من حجم النموذج.
    L1.
    أما الطريقة العادية 1، فغالبًا ما تؤدي إلى تقليل عدد الميزات. بمعنى آخر، غالبًا ما يقلّل الترتيب 1 من حجم النموذج.