หน้านี้ได้รับการแปลโดย Cloud Translation API

การตีความเส้นโค้งการสูญเสีย

แมชชีนเลิร์นนิงจะเป็นเรื่องง่ายหากเส้นโค้งแห่งการสูญเสียทั้งหมดมีลักษณะเช่นนี้ในครั้งแรกที่เราฝึกโมเดล

พล็อตกราฟแสดงเส้นโค้งการสูญเสียที่ดีที่สุดเมื่อฝึกโมเดลแมชชีนเลิร์นนิง
เส้นโค้งการสูญเสียจะวาดบนแกน Y เทียบกับจํานวนขั้นตอนการฝึกบนแกน X เมื่อขั้นตอนการฝึกอบรมเพิ่มขึ้น การสูญเสียจะเริ่มต้นขึ้นสูง ซึ่งจะลดลงแบบทวีคูณ และในที่สุดก็จะถล่มลงจนทําให้สูญเสียขั้นต่ํา

แต่ในความเป็นจริง เส้นโค้งแห่งการสูญเสียอาจเป็นเรื่องยากที่จะตีความได้ โปรดทําความเข้าใจความเข้าใจของเส้นโค้งที่สูญเสียข้อมูลเพื่อตอบคําถามต่อไปนี้

1. โมเดลของฉันจะไม่ฝึก

คุณเมลและเพื่อนก็ทํางานกันเป็นนายหน้ายูนิคอร์นต่อไป เส้นโค้งการสูญหายครั้งแรกมีดังนี้

พล็อตเส้นโค้งของการสูญเสียที่มีแกนเดียวกับพล็อตก่อนหน้า การสูญเสียจะอยู่ในจุดนี้ไม่ราบเรียบ แต่จะเพิ่มขึ้นและลดลงอย่างฉับพลันแทน ซึ่งพล็อตก็ผันผวน

อธิบายปัญหาและวิธีแก้ไขของเมล:

คลิกไอคอนเครื่องหมายบวกเพื่อขยายส่วนดังกล่าวและแสดงคําตอบ

โมเดลของคุณไม่ได้เริ่มบรรจบกัน ลองทําตามขั้นตอนการแก้ไขข้อบกพร่องต่อไปนี้

ตรวจสอบว่าฟีเจอร์คาดการณ์ป้ายกํากับได้หรือไม่โดยทําตามขั้นตอนในการแก้ไขข้อบกพร่องโมเดล
ตรวจสอบข้อมูลเทียบกับสคีมาข้อมูลเพื่อตรวจหาตัวอย่างที่ไม่ถูกต้อง
หากการฝึกดูไม่เสถียร ตามพล็อตนี้ ให้ลดอัตราการเรียนรู้เพื่อป้องกันไม่ให้โมเดลถูกตีกลับในพื้นที่พารามิเตอร์
ลดความซับซ้อนของชุดข้อมูลเพื่อให้แสดงตัวอย่าง 10 ตัวอย่าง ที่ทราบว่าโมเดลคาดการณ์ได้ การสูญเสียชุดข้อมูลลดลงอย่างมาก จากนั้นแก้ไขข้อบกพร่องของโมเดลต่อในชุดข้อมูลทั้งหมด
ลดความซับซ้อนของโมเดลเพื่อให้โมเดลของคุณมีประสิทธิภาพสูงกว่าฐาน จากนั้นเพิ่มความซับซ้อนให้กับโมเดล

2. สูญเสียโอกาสของฉันไปซะแล้ว!

Mel จะแสดงเส้นโค้งอีกเส้นหนึ่ง ปัญหานี้เกิดขึ้นได้อย่างไรและเธอจะแก้ไขปัญหานี้ได้อย่างไร เขียนคําตอบที่ด้านล่าง

พล็อตเส้นโค้งของการสูญเสียที่แสดงการลดลงของการสูญเสียจนถึงขั้นตอนการฝึกจํานวนหนึ่ง และเพิ่มขึ้นอย่างฉับพลันโดยขั้นตอนการฝึกเพิ่มเติม

อธิบายปัญหาและวิธีแก้ไขที่ Mel แก้ไขได้

คลิกไอคอนเครื่องหมายบวกเพื่อขยายส่วนและแสดงคําตอบ

การสูญเสียข้อมูลที่มากขึ้นมักเกิดจากค่าที่ผิดปกติในข้อมูลอินพุต โดยอาจเกิดจากสาเหตุต่อไปนี้

ไม่มีข้อมูล NaN ในข้อมูลอินพุต
ไล่ระดับการไล่ระดับสีเนื่องจากข้อมูลที่ผิดปกติ
การหาร 0
ลอการิทึมของเลขศูนย์หรือค่าลบ

หากต้องการแก้ไขการสูญเสียจํานวนมาก ให้ดูข้อมูลที่ผิดปกติในกลุ่มและในข้อมูลทางวิศวกรรมของคุณ หากความผิดปกติปรากฏว่ามีปัญหา ให้ตรวจสอบสาเหตุ ไม่เช่นนั้น หากความผิดปกติดูคล้ายกับข้อมูลที่ผิดปกติ ให้ตรวจสอบว่าค่าที่ผิดปกติกระจายอยู่เป็นกลุ่มอย่างต่อเนื่องโดยการสับเปลี่ยนข้อมูล

3. เมตริกของฉันขัดแย้งกัน

Mel ต้องการพาคุณไปสู่เส้นโค้งอื่น สิ่งที่จะเกิดขึ้นและ เธอจะแก้ปัญหาได้อย่างไร เขียนคําตอบที่ด้านล่าง

รูปภาพแสดงพล็อตจํานวน 2 รายการ พล็อตทางด้านซ้ายแสดงเส้นโค้งที่สูญเสียไปในอุดมคติ
พล็อตทางด้านขวาจะแสดงเมตริกการเรียกคืนที่เป็น 0 แม้ว่าจํานวนขั้นตอนการฝึกอบรมจะเพิ่มขึ้น

อธิบายปัญหาและวิธีแก้ไขของเมล:

คลิกไอคอนเครื่องหมายบวกเพื่อขยายส่วนดังกล่าวและแสดงคําตอบ

การเรียกคืนค้างอยู่ที่ 0 เนื่องจากความน่าจะเป็นในการจัดประเภทของตัวอย่างไม่สูงกว่าเกณฑ์สําหรับการจัดประเภทเชิงบวก สถานการณ์นี้มักเกิดจากปัญหาความไม่สมดุลของชั้นเรียนมีขนาดใหญ่ โปรดทราบว่าโดยทั่วไปแล้ว ไลบรารี ML เช่น TF Keras จะใช้เกณฑ์เริ่มต้นที่ 0.5 เพื่อคํานวณเมตริกการแยกประเภท

โปรดลองทําตามขั้นตอนต่อไปนี้

ลดเกณฑ์การแยกประเภท

ตรวจสอบเมตริกที่ไม่ผ่านเกณฑ์ เช่น AUC

4. การสูญเสียการทดสอบสูงเกินไป

Mel จะแสดงเส้นโค้งการสูญเสียชุดข้อมูลการฝึกและการทดสอบแล้วถามว่า "เกิดอะไรขึ้น" ลองเขียนคําตอบที่ด้านล่าง

พล็อตเส้นโค้งของการสูญเสียที่แสดงความแตกต่างระหว่างการฝึกและการสูญเสียการทดสอบในรูปแบบที่ฝึก

อธิบายปัญหาและวิธีแก้ไขของเมล:

คลิกไอคอนเครื่องหมายบวกเพื่อขยายส่วนและแสดงคําตอบ

โมเดลของคุณใช้ประโยชน์จากข้อมูลการฝึกอบรมมากเกินไป โปรดลองทำตามขั้นตอนต่อไปนี้

ลดความจุของโมเดล
เพิ่มกฎทั่วไป
ตรวจสอบว่าการแยกการฝึกอบรมและการทดสอบ เทียบเท่ากันในเชิงสถิติ

5. โมเดลของฉันติดค้าง

ใจเย็นๆ เมื่อทางไปรษณีย์กลับมา 2-3 วันและกลับมาพร้อมเส้นโค้งอีกตัว เกิดปัญหาอะไรขึ้นที่นี่และจะแก้ไขเรื่องนี้ได้อย่างไร

พล็อตของเส้นโค้งที่สูญเสียการแสดงผลซึ่งแสดงการสูญเสียที่เริ่มบรรจบกับการฝึก แต่จะแสดงรูปแบบที่ซ้ํากันซึ่งดูเหมือนคลื่นสี่เหลี่ยมผืนผ้า

อธิบายปัญหาและวิธีแก้ไขของเมล:

คลิกไอคอนเครื่องหมายบวกเพื่อขยายส่วนและแสดงคําตอบ

การสูญเสียของคุณแสดงพฤติกรรมที่มีลักษณะคล้ายขั้นตอนที่เกิดขึ้นซ้ําๆ เป็นไปได้ว่าข้อมูลอินพุตที่โมเดลเห็นนั้นเป็นการแสดงพฤติกรรมที่ซ้ํากัน ตรวจดูว่าการสับเปลี่ยนมีการนําพฤติกรรมที่ซ้ํากันออกจากข้อมูลอินพุต

โฆษณาได้ผล

"ตอนนี้ใช้งานได้ดีมาก" Mel อุทาน เธอเอนหลังเข้าไปในเก้าอี้ ด้วยความดีใจและถอนหายใจออกไป เส้นโค้งจะดูสวยงามและมีไฟส่องสว่าง Mel จะใช้เวลาสักครู่เพื่อพูดคุยเรื่องการตรวจสอบ การตรวจสอบความถูกต้องของโมเดลเพิ่มเติม

เมตริกจากการใช้งานจริง

เกณฑ์พื้นฐาน

การสูญเสียสัมบูรณ์สําหรับปัญหาการเกิดปัญหาซ้ํา

เมตริกอื่นๆ สําหรับปัญหาเกี่ยวกับการแยกประเภท

กราฟแสดงเส้นโค้งที่สูญเสียการบรรจบกัน

ทดสอบความเข้าใจ

เมตริกโมเดล