گزینه های زیر را بررسی کنید.

یک مدل خطی با 100 ویژگی ورودی را تصور کنید:
  • 10 بسیار آموزنده هستند.
  • 90 غیر اطلاعاتی هستند.
  • فرض کنید همه ویژگی ها دارای مقادیری بین -1 و 1 هستند. کدام یک از عبارات زیر درست است؟
    تنظیم L1 بسیاری از وزن‌های غیر اطلاعاتی را تشویق می‌کند که تقریباً (اما نه دقیقاً) 0.0 باشند.
    به طور کلی، تنظیم L1 لامبدا کافی تمایل به تشویق ویژگی‌های غیر اطلاعاتی به وزن‌های دقیقاً 0.0 دارد. بر خلاف تنظیم L2، تنظیم L1 به همان سختی به سمت 0.0 فشار می آورد، مهم نیست که وزن چقدر از 0.0 فاصله داشته باشد.
    تنظیم L1 بیشتر وزن های غیر اطلاعاتی را تشویق می کند که دقیقاً 0.0 باشند.
    تنظیم L1 لامبدا کافی تمایل دارد که وزن‌های غیر اطلاعاتی را دقیقاً به 0.0 تبدیل کند. با انجام این کار، این ویژگی های غیر اطلاعاتی از مدل خارج می شوند.
    تنظیم L1 ممکن است باعث شود که ویژگی های اطلاعاتی دقیقاً 0.0 وزن داشته باشند.
    مراقب باشید - تنظیم L1 ممکن است باعث شود که به انواع ویژگی های زیر وزن دقیقاً 0 داده شود:
  • ویژگی های اطلاعاتی ضعیف
  • ویژگی های بسیار آموزنده در مقیاس های مختلف.
  • ویژگی های اطلاعاتی به شدت با سایر ویژگی های آموزنده مشابه همبستگی دارد.