หน้านี้ได้รับการแปลโดย Cloud Translation API

ชุดการฝึกและการทดสอบ: การออกกำลังกายในสนามเด็กเล่น

ชุดการฝึกและชุดทดสอบ

เรากลับไปที่ Playground เพื่อลองใช้ชุดการฝึกและชุดทดสอบ

คลิกไอคอนเครื่องหมายบวกเพื่อช่วยเตือนความหมายของจุดสีส้มและสีน้ำเงิน

ในการแสดงภาพ:

จุดสีน้ำเงินแต่ละจุดหมายถึงตัวอย่างข้อมูล 1 คลาส (เช่น สแปม)
จุดสีส้มแต่ละจุดหมายถึงตัวอย่างข้อมูลอีกประเภทหนึ่ง (เช่น ไม่ใช่สแปม)
สีพื้นหลังแสดงถึงการคาดการณ์ของโมเดลว่าควรพบตัวอย่างของสีใด พื้นหลังสีน้ำเงินรอบจุดสีน้ำเงินหมายความว่าโมเดลคาดการณ์ตัวอย่างนั้นอย่างถูกต้อง ในทางกลับกัน พื้นหลังสีส้มล้อมรอบจุดสีน้ำเงินหมายความว่าโมเดลกำลังคาดการณ์ที่ไม่ถูกต้องสำหรับตัวอย่างนั้น

แบบฝึกหัดนี้มีทั้งชุดทดสอบและชุดการฝึก ซึ่งนำมาจากชุดข้อมูลเดียวกัน โดยค่าเริ่มต้น การแสดงภาพจะแสดงเฉพาะชุดการฝึก หากต้องการเห็นชุดทดสอบด้วย ให้คลิกช่องทำเครื่องหมายแสดงข้อมูลทดสอบใต้การแสดงภาพ ในการแสดงภาพ ให้สังเกตความแตกต่างต่อไปนี้

ตัวอย่างการฝึกจะมีเส้นขอบสีขาว
ตัวอย่างการทดสอบจะมีเส้นขอบสีดำ

งานที่ 1: เรียกใช้ Playground ด้วยการตั้งค่าที่กำหนดโดยทำดังต่อไปนี้

คลิกปุ่มเรียกใช้/หยุดชั่วคราว:
ดูการเปลี่ยนแปลงค่าการสูญเสียการทดสอบและการฝึก
เมื่อค่า Test Loss และการฝึกสูญหายหยุดเปลี่ยนแปลง หรือเปลี่ยนเพียงชั่วขณะ ให้กดปุ่ม "เรียกใช้/หยุดชั่วคราว" อีกครั้งเพื่อหยุด Playground ชั่วคราว

สังเกตเดลต้าระหว่างการสูญเสียการทดสอบกับการสูญเสียการฝึก เราจะพยายามลดเดลต้านี้ ในงานต่อไปนี้

งานที่ 2: ทำสิ่งต่อไปนี้

กดปุ่มรีเซ็ต
แก้ไขอัตราการเรียนรู้
กดปุ่มเรียกใช้/หยุดชั่วคราว:
ให้ Playground ทำงานอย่างน้อย 150 Epoch

ส่วนต่างระหว่างการสูญเสียการทดสอบกับการสูญเสียการฝึกต่ำกว่าหรือสูงขึ้นหรือไม่ด้วยอัตราการเรียนรู้ใหม่นี้ จะเกิดอะไรขึ้นหากคุณแก้ไขทั้งอัตราการเรียนรู้และขนาดกลุ่ม

งานเสริมที่ 3: แถบเลื่อนที่มีป้ายกำกับว่าเปอร์เซ็นต์ข้อมูลการฝึกช่วยให้คุณควบคุมสัดส่วนของข้อมูลการฝึกที่จะทดสอบข้อมูลได้ เช่น เมื่อตั้งค่าเป็น 90% ระบบจะใช้ข้อมูล 90% สำหรับชุดการฝึกและ 10% ที่เหลือจะใช้สำหรับชุดทดสอบ

ทำสิ่งต่อไปนี้:

ลด "เปอร์เซ็นต์ข้อมูลการฝึก" จาก 50% เหลือ 10%
การทดสอบอัตราการเรียนรู้และขนาดกลุ่ม จากนั้นจดหมายเหตุสิ่งที่คุณพบ

การเปลี่ยนเปอร์เซ็นต์ข้อมูลการฝึกจะเปลี่ยนแปลงการตั้งค่าการเรียนรู้ที่เหมาะสมที่สุดที่คุณค้นพบในงานที่ 2 ไหม หากเป็นเช่นนั้น ทำไม

คลิกไอคอนบวกสำหรับคำตอบของงานที่ 1

เมื่อตั้งอัตราการเรียนรู้เป็น 3 (การตั้งค่าเริ่มต้น) การสูญเสียการทดสอบจะสูงกว่าการสูญเสียจากการฝึกมาก

คลิกไอคอนบวกสำหรับคำตอบของงานที่ 2

เมื่อลดอัตราการเรียนรู้ (เช่น เป็น 0.001) การสูญเสียการทดสอบจะลดเป็นค่าที่ใกล้กับการสูญเสียการฝึกมากเป็นอย่างมาก ในการเรียกใช้ส่วนใหญ่ การเพิ่มขนาดแบตช์จะไม่มีผลต่อการสูญเสียการฝึกหรือการทดสอบอย่างมาก อย่างไรก็ตาม ในการเรียกใช้เพียงไม่กี่เปอร์เซ็นต์ การเพิ่มขนาดกลุ่มเป็น 20 ขึ้นไปจะทำให้การสูญเสียการทดสอบลดลงต่ำกว่าการสูญเสียการฝึกเล็กน้อย

ชุดข้อมูลของ Playground จะสร้างขึ้นแบบสุ่ม ดังนั้น คำตอบของเรา อาจไม่เห็นด้วยกับคำตอบของคุณเสมอไป

คลิกไอคอนบวกสำหรับคำตอบของงานที่ 3

การลดเปอร์เซ็นต์ของข้อมูลการฝึกจาก 50% เป็น 10% จะลดจำนวนจุดข้อมูลในชุดการฝึกลงอย่างมาก เนื่องจากมีข้อมูลน้อย ขนาดกลุ่มที่สูงและอัตราการเรียนรู้สูงจะทำให้โมเดลการฝึกข้ามอย่างยุ่งเหยิง (กระโดดซ้ำแล้วซ้ำอีกที่จุดต่ำสุด)

ศูนย์ช่วยเหลือ

การแยกข้อมูล

ตรวจสอบสัญชาตญาณของคุณ