แมชชีนเลิร์นนิงจะเป็นเรื่องง่ายหากเส้นโค้งแห่งการสูญเสียทั้งหมดมีลักษณะเช่นนี้ในครั้งแรกที่เราฝึกโมเดล
แต่ในความเป็นจริง เส้นโค้งแห่งการสูญเสียอาจเป็นเรื่องยากที่จะตีความได้ โปรดทําความเข้าใจความเข้าใจของเส้นโค้งที่สูญเสียข้อมูลเพื่อตอบคําถามต่อไปนี้
1. โมเดลของฉันจะไม่ฝึก
คุณเมลและเพื่อนก็ทํางานกันเป็นนายหน้ายูนิคอร์นต่อไป
เส้นโค้งการสูญหายครั้งแรกมีดังนี้
อธิบายปัญหาและวิธีแก้ไขของเมล:
คลิกไอคอนเครื่องหมายบวกเพื่อขยายส่วนดังกล่าวและแสดงคําตอบ
โมเดลของคุณไม่ได้เริ่มบรรจบกัน ลองทําตามขั้นตอนการแก้ไขข้อบกพร่องต่อไปนี้
- ตรวจสอบว่าฟีเจอร์คาดการณ์ป้ายกํากับได้หรือไม่โดยทําตามขั้นตอนในการแก้ไขข้อบกพร่องโมเดล
- ตรวจสอบข้อมูลเทียบกับสคีมาข้อมูลเพื่อตรวจหาตัวอย่างที่ไม่ถูกต้อง
- หากการฝึกดูไม่เสถียร ตามพล็อตนี้ ให้ลดอัตราการเรียนรู้เพื่อป้องกันไม่ให้โมเดลถูกตีกลับในพื้นที่พารามิเตอร์
- ลดความซับซ้อนของชุดข้อมูลเพื่อให้แสดงตัวอย่าง 10 ตัวอย่าง
ที่ทราบว่าโมเดลคาดการณ์ได้ การสูญเสียชุดข้อมูลลดลงอย่างมาก จากนั้นแก้ไขข้อบกพร่องของโมเดลต่อในชุดข้อมูลทั้งหมด
- ลดความซับซ้อนของโมเดลเพื่อให้โมเดลของคุณมีประสิทธิภาพสูงกว่าฐาน จากนั้นเพิ่มความซับซ้อนให้กับโมเดล
2. สูญเสียโอกาสของฉันไปซะแล้ว!
Mel จะแสดงเส้นโค้งอีกเส้นหนึ่ง ปัญหานี้เกิดขึ้นได้อย่างไรและเธอจะแก้ไขปัญหานี้ได้อย่างไร
เขียนคําตอบที่ด้านล่าง
คลิกไอคอนเครื่องหมายบวกเพื่อขยายส่วนและแสดงคําตอบ
การสูญเสียข้อมูลที่มากขึ้นมักเกิดจากค่าที่ผิดปกติในข้อมูลอินพุต โดยอาจเกิดจากสาเหตุต่อไปนี้
- ไม่มีข้อมูล NaN ในข้อมูลอินพุต
- ไล่ระดับการไล่ระดับสีเนื่องจากข้อมูลที่ผิดปกติ
- การหาร 0
- ลอการิทึมของเลขศูนย์หรือค่าลบ
หากต้องการแก้ไขการสูญเสียจํานวนมาก ให้ดูข้อมูลที่ผิดปกติในกลุ่มและในข้อมูลทางวิศวกรรมของคุณ หากความผิดปกติปรากฏว่ามีปัญหา ให้ตรวจสอบสาเหตุ ไม่เช่นนั้น หากความผิดปกติดูคล้ายกับข้อมูลที่ผิดปกติ ให้ตรวจสอบว่าค่าที่ผิดปกติกระจายอยู่เป็นกลุ่มอย่างต่อเนื่องโดยการสับเปลี่ยนข้อมูล
3. เมตริกของฉันขัดแย้งกัน
Mel ต้องการพาคุณไปสู่เส้นโค้งอื่น สิ่งที่จะเกิดขึ้นและ
เธอจะแก้ปัญหาได้อย่างไร เขียนคําตอบที่ด้านล่าง
อธิบายปัญหาและวิธีแก้ไขของเมล:
คลิกไอคอนเครื่องหมายบวกเพื่อขยายส่วนดังกล่าวและแสดงคําตอบ
การเรียกคืนค้างอยู่ที่ 0 เนื่องจากความน่าจะเป็นในการจัดประเภทของตัวอย่างไม่สูงกว่าเกณฑ์สําหรับการจัดประเภทเชิงบวก สถานการณ์นี้มักเกิดจากปัญหาความไม่สมดุลของชั้นเรียนมีขนาดใหญ่ โปรดทราบว่าโดยทั่วไปแล้ว ไลบรารี ML เช่น TF Keras จะใช้เกณฑ์เริ่มต้นที่ 0.5 เพื่อคํานวณเมตริกการแยกประเภท
โปรดลองทําตามขั้นตอนต่อไปนี้
ลดเกณฑ์การแยกประเภท
ตรวจสอบเมตริกที่ไม่ผ่านเกณฑ์ เช่น AUC
4. การสูญเสียการทดสอบสูงเกินไป
Mel จะแสดงเส้นโค้งการสูญเสียชุดข้อมูลการฝึกและการทดสอบแล้วถามว่า "เกิดอะไรขึ้น" ลองเขียนคําตอบที่ด้านล่าง
อธิบายปัญหาและวิธีแก้ไขของเมล:
คลิกไอคอนเครื่องหมายบวกเพื่อขยายส่วนและแสดงคําตอบ
โมเดลของคุณใช้ประโยชน์จากข้อมูลการฝึกอบรมมากเกินไป โปรดลองทำตามขั้นตอนต่อไปนี้
- ลดความจุของโมเดล
- เพิ่มกฎทั่วไป
- ตรวจสอบว่าการแยกการฝึกอบรมและการทดสอบ
เทียบเท่ากันในเชิงสถิติ
5. โมเดลของฉันติดค้าง
ใจเย็นๆ เมื่อทางไปรษณีย์กลับมา 2-3 วันและกลับมาพร้อมเส้นโค้งอีกตัว เกิดปัญหาอะไรขึ้นที่นี่และจะแก้ไขเรื่องนี้ได้อย่างไร
อธิบายปัญหาและวิธีแก้ไขของเมล:
คลิกไอคอนเครื่องหมายบวกเพื่อขยายส่วนและแสดงคําตอบ
การสูญเสียของคุณแสดงพฤติกรรมที่มีลักษณะคล้ายขั้นตอนที่เกิดขึ้นซ้ําๆ เป็นไปได้ว่าข้อมูลอินพุตที่โมเดลเห็นนั้นเป็นการแสดงพฤติกรรมที่ซ้ํากัน ตรวจดูว่าการสับเปลี่ยนมีการนําพฤติกรรมที่ซ้ํากันออกจากข้อมูลอินพุต
โฆษณาได้ผล
"ตอนนี้ใช้งานได้ดีมาก" Mel อุทาน เธอเอนหลังเข้าไปในเก้าอี้
ด้วยความดีใจและถอนหายใจออกไป เส้นโค้งจะดูสวยงามและมีไฟส่องสว่าง Mel จะใช้เวลาสักครู่เพื่อพูดคุยเรื่องการตรวจสอบ
การตรวจสอบความถูกต้องของโมเดลเพิ่มเติม
เมตริกจากการใช้งานจริง
เกณฑ์พื้นฐาน
การสูญเสียสัมบูรณ์สําหรับปัญหาการเกิดปัญหาซ้ํา
เมตริกอื่นๆ สําหรับปัญหาเกี่ยวกับการแยกประเภท