การปรับเปลี่ยนทั่วไปหมายถึงความสามารถของโมเดลในการปรับให้เหมาะสมกับข้อมูลใหม่ที่ไม่เคยเห็นมาก่อน ซึ่งได้มาจากการกระจายเดียวกันกับที่ใช้สร้างโมเดล
ภาพรวม
รูปภาพขนาดใหญ่
- เป้าหมาย: คาดการณ์ข้อมูลใหม่ที่ดึงมาจาก (ซ่อน) การกระจายจริงได้เป็นอย่างดี
- ปัญหา: เราไม่เห็นความจริง
- เราเป็นเพียงตัวอย่างเท่านั้น
รูปภาพขนาดใหญ่
- เป้าหมาย: คาดการณ์ข้อมูลใหม่ที่ดึงมาจาก (ซ่อน) การกระจายจริงได้เป็นอย่างดี
- ปัญหา: เราไม่เห็นความจริง
- เราเป็นเพียงตัวอย่างเท่านั้น
- หากโมเดล h ตรงกับตัวอย่างปัจจุบันของเราได้ดี เราจะเชื่อมั่นว่าโมเดลนั้นจะคาดการณ์ตัวอย่างใหม่อื่นๆ ได้ดีได้อย่างไร
ฉันจะทราบได้อย่างไรว่าโมเดลของเราดีหรือไม่
- ตามหลักทฤษฎี
- ช่องที่น่าสนใจ: ทฤษฎีทั่วไป
- อิงตามแนวคิดในการวัดความเรียบง่าย / ความซับซ้อนของโมเดล
- สัญชาตญาณ: การประดิษฐ์อย่างเป็นทางการของ Ockham's Razor
- ยิ่งโมเดลมีความซับซ้อนมากเท่าใด ผลลัพธ์เชิงผลลัพธ์ที่ดีก็ไม่ได้เพียงเกิดจากลักษณะของกลุ่มตัวอย่างเท่านั้น
ฉันจะทราบได้อย่างไรว่าโมเดลของเราดีหรือไม่
- เน้นที่:
- ถาม: โมเดลของเราจะทํางานได้ดีกับข้อมูลตัวอย่างใหม่หรือไม่
- ประเมิน: รับตัวอย่างใหม่จากข้อมูล ซึ่งเรียกว่าชุดทดสอบ
- ประสิทธิภาพที่ดีในชุดทดสอบคือตัวบ่งชี้ประสิทธิภาพที่ดีของข้อมูลใหม่โดยทั่วไป
- หากชุดการทดสอบมีขนาดใหญ่พอ
- หากเราไม่โกงข้อสอบโดยใช้ชุดการทดสอบซ้ําหลายครั้ง
ML ข้อกําหนดและเงื่อนไข
สมมติฐานเบื้องต้นทั้ง 3 ข้อข้างต้น
- เราสุ่มแสดงตัวอย่างอิสระและเหมือนกันทุกประการ (กล่าวคือ) จากการเผยแพร่
- การเผยแพร่เป็นแบบชั่วคราว: จะไม่มีการเปลี่ยนแปลงเมื่อเวลาผ่านไป
- เราดึงมาจากการกระจายเดียวกันเสมอ ได้แก่ ชุดการฝึก การตรวจสอบ และการทดสอบ