ทำให้มีความสม่ำเสมอ: ตรวจสอบความเข้าใจ

การกำหนดกฎ L1

ลองดูตัวเลือกด้านล่าง

สมมติว่าโมเดลเชิงเส้นที่มีฟีเจอร์อินพุต 100 รายการ
  • 10 ให้ข้อมูลได้ดีมาก
  • รหัส 90 ไม่ได้ให้ข้อมูล
  • สมมติว่าจุดสนใจทั้งหมดมีค่าระหว่าง -1 ถึง 1 ข้อความใดต่อไปนี้เป็นจริง
    การกำหนดกฎ L1 จะส่งเสริมให้น้ำหนักที่ไม่ได้ข้อมูลมีค่าเกือบ (แต่ไม่ตรง) 0.0
    โดยทั่วไป การกำหนด L1 ให้ระบุ lambda ที่เพียงพอมีแนวโน้มจะส่งเสริมให้ฟีเจอร์ที่ไม่ให้ข้อมูลมีน้ำหนักเท่ากับ 0.0 การทำแบบ L1 ต่างจากการทำ L2 ตรงที่การเรียก 1 ระดับจะ "ผลักดัน" ยากพอๆ กับ 0.0 ไม่ว่าจะมีน้ำหนักจาก 0.0 มากเพียงใด
    การกำหนดกฎ L1 จะส่งเสริมให้น้ำหนักที่ไม่มีข้อมูลส่วนใหญ่มีค่าเป็น 0.0 พอดี
    การกำหนดจำนวนแลมด้าให้เพียงพอใน L1 มักจะส่งเสริมให้น้ำหนักแบบไม่ได้ให้ข้อมูลมีค่าเท่ากับ 0.0 พอดี การดำเนินการดังกล่าวจะทำให้ฟีเจอร์ที่ไม่ให้ข้อมูลเหล่านี้ออกจากโมเดล
    การกำหนดกฎ L1 อาจทำให้ฟีเจอร์ที่ให้ข้อมูลได้รับน้ำหนักเท่ากับ 0.0
    โปรดระวัง การกำหนดกฎ L1 อาจทำให้ฟีเจอร์ประเภทต่อไปนี้มีน้ำหนักเป็น 0
  • ฟีเจอร์ที่ให้ข้อมูลเล็กน้อย
  • ฟีเจอร์ที่ให้ข้อมูลจำนวนมากในหลายระดับ
  • ฟีเจอร์ที่ให้ข้อมูลเกี่ยวข้องอย่างมากกับฟีเจอร์อื่นๆ ที่ให้ข้อมูลคล้ายกัน
  • การทำให้เป็นมาตรฐาน L1 เทียบกับ L2

    ลองดูตัวเลือกด้านล่าง

    สมมติว่าโมเดลเชิงเส้นที่มีฟีเจอร์อินพุต 100 รายการ ทั้งหมดมีค่าระหว่าง -1 ถึง 1 ดังนี้
  • 10 ให้ข้อมูลได้ดีมาก
  • รหัส 90 ไม่ได้ให้ข้อมูล
  • การกำหนดกฎประเภทใดจะสร้างโมเดลที่เล็กกว่าได้
    การกำหนดกฎ L2
    การกำหนดกฎ L2 แทบจะไม่ลดจำนวนฟีเจอร์ กล่าวคือ การกำหนดกฎ L2 แทบจะไม่ลดขนาดโมเดล
    การกำหนดกฎ L1
    การกำหนดกฎ L1 มีแนวโน้มที่จะลดจำนวนฟีเจอร์ กล่าวคือ การกำหนดกฎ L1 มักจะลดขนาดโมเดล