ชุดการฝึกและชุดทดสอบ
เรากลับไปที่ Playground เพื่อลองใช้ชุดการฝึกและชุดทดสอบ
คลิกไอคอนเครื่องหมายบวกเพื่อช่วยเตือนความหมายของจุดสีส้มและสีน้ำเงิน
ในการแสดงภาพ:
- จุดสีน้ำเงินแต่ละจุดหมายถึงตัวอย่างข้อมูล 1 คลาส (เช่น สแปม)
- จุดสีส้มแต่ละจุดหมายถึงตัวอย่างข้อมูลอีกประเภทหนึ่ง (เช่น ไม่ใช่สแปม)
- สีพื้นหลังแสดงถึงการคาดการณ์ของโมเดลว่าควรพบตัวอย่างของสีใด พื้นหลังสีน้ำเงินรอบจุดสีน้ำเงินหมายความว่าโมเดลคาดการณ์ตัวอย่างนั้นอย่างถูกต้อง ในทางกลับกัน พื้นหลังสีส้มล้อมรอบจุดสีน้ำเงินหมายความว่าโมเดลกำลังคาดการณ์ที่ไม่ถูกต้องสำหรับตัวอย่างนั้น
แบบฝึกหัดนี้มีทั้งชุดทดสอบและชุดการฝึก ซึ่งนำมาจากชุดข้อมูลเดียวกัน โดยค่าเริ่มต้น การแสดงภาพจะแสดงเฉพาะชุดการฝึก หากต้องการเห็นชุดทดสอบด้วย ให้คลิกช่องทำเครื่องหมายแสดงข้อมูลทดสอบใต้การแสดงภาพ ในการแสดงภาพ ให้สังเกตความแตกต่างต่อไปนี้
- ตัวอย่างการฝึกจะมีเส้นขอบสีขาว
- ตัวอย่างการทดสอบจะมีเส้นขอบสีดำ
งานที่ 1: เรียกใช้ Playground ด้วยการตั้งค่าที่กำหนดโดยทำดังต่อไปนี้
- คลิกปุ่มเรียกใช้/หยุดชั่วคราว:
- ดูการเปลี่ยนแปลงค่าการสูญเสียการทดสอบและการฝึก
- เมื่อค่า Test Loss และการฝึกสูญหายหยุดเปลี่ยนแปลง
หรือเปลี่ยนเพียงชั่วขณะ ให้กดปุ่ม "เรียกใช้/หยุดชั่วคราว" อีกครั้งเพื่อหยุด Playground ชั่วคราว
สังเกตเดลต้าระหว่างการสูญเสียการทดสอบกับการสูญเสียการฝึก เราจะพยายามลดเดลต้านี้
ในงานต่อไปนี้
งานที่ 2: ทำสิ่งต่อไปนี้
- กดปุ่มรีเซ็ต
- แก้ไขอัตราการเรียนรู้
- กดปุ่มเรียกใช้/หยุดชั่วคราว:
- ให้ Playground ทำงานอย่างน้อย 150 Epoch
ส่วนต่างระหว่างการสูญเสียการทดสอบกับการสูญเสียการฝึกต่ำกว่าหรือสูงขึ้นหรือไม่ด้วยอัตราการเรียนรู้ใหม่นี้ จะเกิดอะไรขึ้นหากคุณแก้ไขทั้งอัตราการเรียนรู้และขนาดกลุ่ม
งานเสริมที่ 3: แถบเลื่อนที่มีป้ายกำกับว่าเปอร์เซ็นต์ข้อมูลการฝึกช่วยให้คุณควบคุมสัดส่วนของข้อมูลการฝึกที่จะทดสอบข้อมูลได้ เช่น เมื่อตั้งค่าเป็น 90% ระบบจะใช้ข้อมูล 90% สำหรับชุดการฝึกและ 10% ที่เหลือจะใช้สำหรับชุดทดสอบ
ทำสิ่งต่อไปนี้:
- ลด "เปอร์เซ็นต์ข้อมูลการฝึก" จาก 50% เหลือ 10%
- การทดสอบอัตราการเรียนรู้และขนาดกลุ่ม จากนั้นจดหมายเหตุสิ่งที่คุณพบ
การเปลี่ยนเปอร์เซ็นต์ข้อมูลการฝึกจะเปลี่ยนแปลงการตั้งค่าการเรียนรู้ที่เหมาะสมที่สุดที่คุณค้นพบในงานที่ 2 ไหม หากเป็นเช่นนั้น ทำไม
คลิกไอคอนบวกสำหรับคำตอบของงานที่ 1
เมื่อตั้งอัตราการเรียนรู้เป็น 3 (การตั้งค่าเริ่มต้น)
การสูญเสียการทดสอบจะสูงกว่าการสูญเสียจากการฝึกมาก
คลิกไอคอนบวกสำหรับคำตอบของงานที่ 2
เมื่อลดอัตราการเรียนรู้ (เช่น เป็น 0.001) การสูญเสียการทดสอบจะลดเป็นค่าที่ใกล้กับการสูญเสียการฝึกมากเป็นอย่างมาก ในการเรียกใช้ส่วนใหญ่ การเพิ่มขนาดแบตช์จะไม่มีผลต่อการสูญเสียการฝึกหรือการทดสอบอย่างมาก อย่างไรก็ตาม ในการเรียกใช้เพียงไม่กี่เปอร์เซ็นต์ การเพิ่มขนาดกลุ่มเป็น 20 ขึ้นไปจะทำให้การสูญเสียการทดสอบลดลงต่ำกว่าการสูญเสียการฝึกเล็กน้อย
ชุดข้อมูลของ Playground จะสร้างขึ้นแบบสุ่ม ดังนั้น คำตอบของเรา
อาจไม่เห็นด้วยกับคำตอบของคุณเสมอไป
คลิกไอคอนบวกสำหรับคำตอบของงานที่ 3
การลดเปอร์เซ็นต์ของข้อมูลการฝึกจาก 50% เป็น 10% จะลดจำนวนจุดข้อมูลในชุดการฝึกลงอย่างมาก เนื่องจากมีข้อมูลน้อย ขนาดกลุ่มที่สูงและอัตราการเรียนรู้สูงจะทำให้โมเดลการฝึกข้ามอย่างยุ่งเหยิง (กระโดดซ้ำแล้วซ้ำอีกที่จุดต่ำสุด)