ทดสอบความเข้าใจ: การแก้ไขข้อบกพร่องของโมเดล

สําหรับคําถามต่อไปนี้ ให้คลิกสิ่งที่คุณเลือกเพื่อขยายและตรวจสอบคําตอบของคุณ

แนวทางการประมาณ

คุณและเพื่อนชื่อ Mel ชอบยูนิคอร์น ในความเป็นจริง คุณชอบยูนิคอร์นมาก คุณเลือกที่จะคาดการณ์การปรากฏของยูนิคอร์นโดยใช้ ... แมชชีนเลิร์นนิง คุณมีชุดข้อมูลยูนิคอร์น 10,000 ลักษณะที่ปรากฏ สําหรับแต่ละลักษณะที่ปรากฏ ชุดข้อมูลจะมีตําแหน่ง ช่วงเวลาของวัน ระดับความสูง อุณหภูมิ ความชื้น ความหนาแน่นของประชากร การปกคลุมของต้นไม้ สีรุ้ง และฟีเจอร์อื่นๆ อีกมากมาย

คุณต้องการเริ่มต้นพัฒนาโมเดล ML วิธีการใดต่อไปนี้เป็นวิธีเริ่มต้นการพัฒนาที่ดี
ยูนิคอร์นมักปรากฏในช่วงเช้าตรู่และยามโพล้เพล้ ดังนั้นโปรดใช้ฟีเจอร์ "ช่วงเวลาของวัน" เพื่อสร้างรูปแบบเชิงเส้น
ถูกต้อง โมเดลเชิงเส้นที่ใช้ฟีเจอร์การคาดการณ์ขั้นสูง 1 หรือ 2 รายการเป็นวิธีเริ่มต้นที่มีประสิทธิภาพ
การคาดเดาว่าจะปรากฏยูนิคอร์นเป็นปัญหาที่ยากไหม ดังนั้น ให้ใช้เครือข่ายระบบประสาทเทียมที่มีฟีเจอร์ทั้งหมด
ผิด การเริ่มด้วยโมเดลที่ซับซ้อนจะทําให้การแก้ไขข้อบกพร่องซับซ้อนขึ้น
เริ่มต้นด้วยรูปแบบเชิงเส้นแบบง่าย แต่ใช้ฟีเจอร์ทั้งหมดเพื่อให้โมเดลแบบง่ายมีการคาดการณ์
ผิด หากคุณใช้ฟีเจอร์จํานวนมาก แม้ว่าจะใช้รูปแบบเชิงเส้นก็ตาม โมเดลที่ได้จะซับซ้อนและแก้ไขข้อบกพร่องได้ยาก

เกณฑ์พื้นฐาน

เมื่อใช้การเกิดปัญหาการถดถอยโดยที่ค่ามัธยฐานของความคลาดเคลื่อน (MSE) เฉลี่ย คุณจะได้คาดการณ์ค่าโดยสารจากแท็กซี่ โดยใช้ระยะเวลาของการโดยสาร ระยะทาง ต้นทาง และจุดสิ้นสุดของการเดินทาง คุณก็ทราบ

  • ค่าโดยสารโดยเฉลี่ยคือ $15
  • ค่าโดยสารเพิ่มขึ้นตามจํานวนคงที่ต่อกิโลเมตร
  • หากคิดค่าบริการภายในย่านใจกลางเมือง มีค่าบริการเพิ่มเติม
  • ค่าโดยสารจะเริ่มที่ราคาขั้นต่ํา $3

พิจารณาว่าเกณฑ์พื้นฐานต่อไปนี้มีประโยชน์หรือไม่

นี่คือเกณฑ์พื้นฐานที่มีประโยชน์: การเดินทางแต่ละครั้งมีราคา $15
ใช่
ถูกต้อง ต้นทุนเฉลี่ยเป็นเกณฑ์พื้นฐานที่มีประโยชน์
ไม่ได้
ผิด การคาดการณ์ค่าเฉลี่ยจะทําให้ MSE ต่ํากว่าการคาดการณ์ค่าอื่นๆ เสมอ ดังนั้น การทดสอบโมเดลกับเกณฑ์พื้นฐานนี้จึงเป็นการเปรียบเทียบที่มีความหมายได้
ขึ้นอยู่กับค่าเบี่ยงเบนมาตรฐานของค่าโดยสาร
ผิด ไม่ว่าจะประหยัดค่าเบี่ยงเบนมาตรฐานเท่าใด ค่าโดยสารโดยเฉลี่ยจะเป็นพื้นฐานที่มีประโยชน์เนื่องจากการคาดการณ์ค่าเฉลี่ยให้ MSE ต่ํากว่าเสมอเมื่อเปรียบเทียบกับการคาดการณ์ค่าอื่นๆ เสมอ
ตัวแปรนี้เป็นพื้นฐานที่มีประโยชน์หรือไม่ โมเดลที่ได้รับการฝึกซึ่งใช้เฉพาะระยะเวลาและต้นทางเป็นฟีเจอร์
ใช่
ผิด คุณควรใช้โมเดลที่ฝึกแล้วเป็นเกณฑ์พื้นฐานหลังจากโมเดลได้รับการตรวจสอบความถูกต้องเต็มรูปแบบในเวอร์ชันที่ใช้งานจริงแล้วเท่านั้น นอกจากนี้ โมเดลที่ฝึกแล้วควรมีการตรวจสอบกับเกณฑ์พื้นฐานที่เรียบง่ายยิ่งขึ้น
ไม่ได้
ถูกต้อง คุณควรใช้โมเดลที่ฝึกแล้วเป็นเกณฑ์พื้นฐานหลังจากโมเดลได้รับการตรวจสอบความถูกต้องเต็มรูปแบบในเวอร์ชันที่ใช้งานจริงแล้วเท่านั้น
ค่าเดินทางเป็นข้อมูลพื้นฐานที่มีประโยชน์หรือไม่ โดยค่าโดยสารคือระยะทางระหว่างเดินทาง (เป็นกิโลเมตร) คูณด้วยค่าโดยสารต่อกิโลเมตร
ใช่
ถูกต้อง ระยะทางเป็นปัจจัยที่สําคัญที่สุดในการกําหนดค่าโดยสาร ดังนั้น เกณฑ์พื้นฐานที่ใช้ระยะทางจึงมีประโยชน์
ไม่ได้
ผิด ระยะทางเป็นปัจจัยที่สําคัญที่สุดในการกําหนดค่าโดยสาร ดังนั้น เกณฑ์พื้นฐานที่ใช้ระยะทางจึงมีประโยชน์
เกณฑ์พื้นฐานนี้เป็นประโยชน์ไหม ค่าโดยสารคือ $1 เนื่องจากโมเดลดังกล่าวต้องให้สูงกว่าเกณฑ์พื้นฐานนี้เสมอ หากโมเดลไม่เป็นไปตามเกณฑ์พื้นฐานนี้ เราจะมั่นใจได้ว่าโมเดลมีข้อบกพร่อง
ใช่
ผิด ค่านี้ไม่ใช่พื้นฐานที่มีประโยชน์ เนื่องจากมักจะไม่ถูกต้องเสมอ การเปรียบเทียบโมเดลกับเกณฑ์ที่ผิดเสมอไม่มีความหมาย
ไม่ได้
ถูกต้อง เกณฑ์พื้นฐานนี้ไม่ใช่การทดสอบที่มีประโยชน์ของโมเดลของคุณ

ไฮเปอร์พารามิเตอร์

คําถามต่อไปนี้อธิบายปัญหาในการฝึกตัวแยกประเภท เลือกการดําเนินการที่อาจช่วยแก้ปัญหาที่อธิบายไว้

การสูญเสียการฝึกจะเท่ากับ 0.24 และการสูญเสียการตรวจสอบคือ 0.36 การดําเนินการ 2 อย่างใดต่อไปนี้ช่วยลดความแตกต่างระหว่างการฝึกและการสูญเสียการตรวจสอบได้
ตรวจสอบว่าชุดการฝึกและการตรวจสอบมีพร็อพเพอร์ตี้ทางสถิติเหมือนกัน
ถูกต้อง หากชุดการฝึกและการตรวจสอบมีพร็อพเพอร์ตี้ทางสถิติที่แตกต่างกัน ข้อมูลการฝึกก็จะไม่ช่วยในการคาดการณ์ข้อมูลการตรวจสอบ
ใช้การปรับข้อมูลให้เป็นมาตรฐานเพื่อป้องกันการใช้มากเกินไป
ถูกต้อง หากการฝึกที่สูญเสียไปน้อยกว่าการสูญเสียการตรวจสอบ โมเดลของคุณอาจมีแนวโน้มที่จะมีข้อมูลการฝึกมากเกินไป การปรับให้สอดคล้องตามมาตรฐานจะป้องกันไม่ให้เกิดการเน้นมากเกินไป
เพิ่มจํานวนการฝึก Epoch
ผิด หากการสูญเสียการฝึกน้อยกว่าการสูญเสียการตรวจสอบ แสดงว่าโมเดลของคุณมักจะจัดหนักกับข้อมูลการฝึก การเพิ่ม Epoch ของการฝึกจะเป็นการเพิ่มการออกกําลังกายมากเกินไป
ลดอัตราการเรียนรู้
ผิด การสูญเสียการตรวจสอบที่มากกว่าการสูญเสียการฝึกอบรมมักจะบ่งชี้ว่ามีการติดตั้งมากเกินไป การเปลี่ยนอัตราการเรียนรู้ไม่ได้ทําให้ประสิทธิภาพลดลงมากเกินไป
คุณดําเนินการที่ถูกต้องตามที่อธิบายไว้ในคําถามก่อนหน้า และตอนนี้การฝึกและการสูญเสียการตรวจสอบลดลงจาก 1.0 เหลือประมาณ 0.24 หลังจากการฝึกสําหรับหลายช่วงเวลา การดําเนินการในข้อใดต่อไปนี้ช่วยลดการสูญเสียการฝึกได้อีก
เพิ่มความลึกและความกว้างของโครงข่ายระบบประสาทเทียม
ถูกต้อง หากการฝึกลดลงอย่างต่อเนื่องที่ 0.24 หลังจากการฝึกสําหรับ Epoch หลายรายการ โมเดลของคุณอาจขาดการคาดการณ์ที่จะลดการสูญเสียลงอีก การเพิ่ม ความลึกและความกว้างของโมเดลอาจทําให้โมเดลมีความสามารถในการคาดการณ์เพิ่มเติมที่จําเป็นเพื่อลดการสูญเสียการฝึกต่อไป
เพิ่มจํานวนการฝึก Epoch
ผิด หากการฝึกของคุณยังคงอยู่ที่ 0.24 หลังจากการฝึกสําหรับหลายช่วงเวลา การฝึกโมเดลต่อไปจะไม่ทําให้การสูญเสียการฝึกลดลงอย่างมาก
เพิ่มอัตราการเรียนรู้
ผิด เนื่องจากการสูญเสียการฝึกไม่ได้ลดลงในการฝึกหลายช่วงเวลา การเพิ่มอัตราการเรียนรู้จึงไม่ได้ทําให้สูญเสียการฝึกอบรมครั้งสุดท้ายน้อยลง แต่การเพิ่มอัตราการเรียนรู้อาจทําให้การฝึกไม่เสถียรและป้องกันไม่ให้โมเดลเรียนรู้ข้อมูล
คุณดําเนินการในคําถามข้อก่อนหน้าให้ถูกต้อง การฝึก ของโมเดลลดลงเหลือ 0.20 สมมติว่าคุณต้องลดการสูญเสียการฝึกโมเดลอีกเล็กน้อย คุณเพิ่มฟีเจอร์บางอย่างที่ดูเหมือนจะใช้การคาดการณ์ได้ อย่างไรก็ตาม การสูญเสียการฝึกยังคงผันผวน ประมาณ 0.20 ตัวเลือก 3 ข้อใดต่อไปนี้ช่วยลดการสูญเสียการฝึกอบรมได้
เพิ่มความลึกและความกว้างของเลเยอร์
ถูกต้อง โมเดลของคุณอาจไม่มีความสามารถในการเรียนรู้สัญญาณตามการคาดการณ์ในฟีเจอร์ใหม่ๆ
เพิ่มเวลาการฝึก
ผิด หากการสูญเสียการฝึกโมเดลของโมเดลมีความผันผวนประมาณ 0.20 การเพิ่มจํานวน Epoch ของการฝึกอาจทําให้การสูญเสียการฝึกโมเดลของโมเดลมีความผันผวนประมาณ 0.20 ต่อไป
ฟีเจอร์จะไม่เพิ่มข้อมูลที่เกี่ยวข้องกับฟีเจอร์ที่มีอยู่ ลองใช้ฟีเจอร์อื่นๆ
ถูกต้อง อาจเป็นไปได้ว่าสัญญาณการคาดการณ์ที่เข้ารหัสจากฟีเจอร์มีอยู่แล้วในฟีเจอร์ที่คุณใช้อยู่
ลดอัตราการเรียนรู้
ถูกต้อง อาจเป็นไปได้ว่าการเพิ่มฟีเจอร์ใหม่จะทําให้ปัญหาซับซ้อนขึ้น กล่าวอย่างเจาะจงคือ ความผันผวนที่สูญเสียไปบ่งชี้ว่าอัตราการเรียนรู้สูงเกินไป และโมเดลของคุณกระโดดไปรอบๆ ต่ําสุด การลดอัตราการเรียนรู้จะทําให้โมเดล เรียนรู้ Minimin ได้