ขอแนะนําฟีเจอร์ครอส
ฟีเจอร์สามารถข้ามโมเดลเพื่อให้พอดีกับข้อมูลที่ไม่ใช่แบบเชิงเส้นได้จริงหรือ
มาดูการออกกําลังกายแบบฝึกหัดนี้เลย
งาน: ลองสร้างโมเดลที่แยกจุดสีน้ําเงินออกจากจุดสีส้มโดยการเปลี่ยนน้ําหนักของฟีเจอร์อินพุต 3 รายการต่อไปนี้ด้วยตนเอง
- x1
- x2
- x1 x2 (กากบาทสําหรับคุณลักษณะ)
วิธีการเปลี่ยนน้ําหนักด้วยตนเอง
- คลิกที่เส้นเชื่อมต่อฟีเจอร์กับเอาต์พุต
แบบฟอร์มการป้อนข้อมูลจะปรากฏขึ้น
- พิมพ์ค่าจุดลอยตัวลงในแบบฟอร์มอินพุตนั้น
- กด Enter
โปรดทราบว่าอินเทอร์เฟซสําหรับแบบฝึกหัดนี้ไม่มีปุ่มขั้นตอน
เพราะแบบฝึกหัดนี้ไม่ใช่การฝึกโมเดลซ้ํา
คุณจะต้องป้อนน้ําหนัก "final" สําหรับโมเดลด้วยตนเองแทน
(คําตอบจะปรากฏใต้แบบฝึกหัด)
คลิกไอคอนบวกเพื่อดูคําตอบ
- w1 = 0
- w2 = 0
- x1 x2 = 1 (หรือค่าบวกใดๆ)
หากคุณป้อนค่าที่เป็นลบสําหรับฟีเจอร์กากบาท โมเดลจะแยกจุดสีน้ําเงินออกจากจุดสีส้ม แต่การคาดคะเนจะไม่ถูกต้องโดยสิ้นเชิง
กล่าวคือ โมเดลจะคาดการณ์สีส้มสําหรับจุดสีน้ําเงิน และสีฟ้าสําหรับจุดสีส้ม
ไม้กางเขนสถานที่ที่ซับซ้อนมากขึ้น
มาเล่นกับชุดค่าผสมของฟีเจอร์ขั้นสูงขั้นสูงกันบ้าง
ข้อมูลที่ตั้งไว้ในแบบฝึกหัด Playground นี้คล้ายกับลูกตาดังๆ จากเกมปาเป้าที่มีจุดสีน้ําเงินอยู่ตรงกลางและมีจุดสีส้มอยู่ในวงนอก
คลิกไอคอนบวกเพื่อดูคําอธิบายในการแสดงภาพของโมเดล
แบบฝึกหัดแต่ละรายการใน Playground จะแสดงสถานะปัจจุบันของโมเดล ตัวอย่างเช่น ด้านล่างนี้เป็นการแสดงภาพ
โปรดคํานึงถึงสิ่งต่อไปนี้เกี่ยวกับการแสดงภาพโมเดล
- แต่ละแกนแสดงคุณลักษณะที่เจาะจง ในกรณีที่เป็นจดหมายขยะหรือไม่ใช่สแปม ฟีเจอร์อาจเป็นจํานวนคําและจํานวนผู้รับอีเมล
- แต่ละจุดจะแสดงค่าของฟีเจอร์สําหรับตัวอย่างข้อมูลเพียง 1 ตัวอย่าง เช่น อีเมล
- สีของจุดแสดงถึงคลาสในตัวอย่างนี้
เช่น จุดสีน้ําเงินอาจหมายถึงอีเมลที่ไม่ใช่สแปม ส่วนจุดสีส้มอาจหมายถึงอีเมลสแปม
- สีพื้นหลังแสดงถึงการคาดคะเนโมเดลที่จะพบตัวอย่างสีดังกล่าว พื้นหลังสีฟ้ารอบจุดสีน้ําเงิน
บ่งบอกว่าโมเดลกําลังคาดการณ์ตัวอย่างดังกล่าวอย่างถูกต้อง ในทางกลับกัน พื้นหลังสีส้มรอบจุดสีน้ําเงินหมายความว่าโมเดลคาดการณ์ตัวอย่างนั้นไม่ถูกต้อง
- สีน้ําเงินและสีส้มอาจมีการปรับขนาด เช่น ภาพทางด้านซ้ายของเป็นสีน้ําเงินทึบ แต่ค่อยๆ จางลงเป็นสีขาวตรงกลางภาพ ระดับความเข้มของสีเป็นเหมือนการชี้ให้เห็นถึงความเชื่อมั่นในโมเดล สีน้ําเงินทึบมากหมายความว่าโมเดลมีความมั่นใจมากเกี่ยวกับการคาดเดาและสีน้ําเงินอ่อนหมายความว่าโมเดลมีความมั่นใจน้อยกว่า (การแสดงภาพโมเดลที่แสดงในรูปทําการคาดการณ์ได้ไม่ดีนัก)
ใช้การแสดงภาพเพื่อตัดสินความคืบหน้าของโมเดล
("ดีมาก จุดสีน้ําเงินส่วนใหญ่มีพื้นหลังสีฟ้า" หรือ
&"ไม่ จุดสีน้ําเงินจะมีพื้นหลังสีส้ม")
นอกจากสีสันแล้ว Playground
ยังแสดงการสูญเสียในปัจจุบันของตัวเลขอีกด้วย
("ไม่ ความสูญเสียจะเพิ่มขึ้นแทนที่จะลดลง")
งานที่ 1: เรียกใช้รูปแบบเชิงเส้นนี้ตามที่กําหนดไว้ ใช้เวลา 1 หรือ 2 นาที (แต่ไม่เกิน) เพื่อลองใช้การตั้งค่าอัตราการเรียนรู้ต่างๆ เพื่อดูว่าคุณจะหาการปรับปรุงได้หรือไม่ โมเดลเชิงเส้นจะสร้างผลลัพธ์ที่มีประสิทธิภาพสําหรับชุดข้อมูลนี้ได้ไหม
งานที่ 2: ลองเพิ่มฟีเจอร์ข้ามผลิตภัณฑ์ เช่น x1x2 เพื่อเพิ่มประสิทธิภาพ
- ฟีเจอร์ใดมีประโยชน์มากที่สุด
- ประสิทธิภาพที่ดีที่สุดที่คุณจะได้รับคืออะไร
งานที่ 3: เมื่อมีโมเดลที่ดี ให้ตรวจสอบแพลตฟอร์มเอาต์พุตของโมเดล (แสดงโดยสีพื้นหลัง)
- จะดูเหมือนรูปแบบเชิงเส้นไหม
- คุณจะอธิบายเกี่ยวกับโมเดลอย่างไร
(คําตอบจะปรากฏใต้แบบฝึกหัด)
คลิกไอคอนบวกเพื่อดูคําตอบของคําถามที่ 1
ไม่ได้ โมเดลเชิงเส้นจะสร้างโมเดลชุดข้อมูลนี้อย่างมีประสิทธิภาพไม่ได้ การลดอัตราการเรียนรู้จะลดการสูญเสีย แต่การสูญหายก็ยังมาบรรจบกันในมูลค่าที่สูงจนยอมรับไม่ได้
คลิกไอคอนเครื่องหมายบวกเพื่อดูคําตอบของคําถามที่ 2
ระบบจะสร้างชุดข้อมูลของ Playground ##99 ขึ้นมาแบบสุ่ม ด้วยเหตุนี้ คําตอบของเราอาจไม่ตรงกับคําตอบของคุณเสมอไป ที่จริงแล้ว หากสร้างชุดข้อมูลระหว่างการเรียกใช้อีกครั้ง ผลลัพธ์ของคุณเองจะไม่เห็นด้วยกับการเรียกใช้ก่อนหน้าทุกครั้ง อย่างไรก็ตาม คุณจะเห็นผลลัพธ์ที่ดีขึ้น
โดยทําตามขั้นตอนต่อไปนี้
-
การใช้ทั้ง x12 และ x22 เป็นกากบาทในฟีเจอร์ (การเพิ่ม x1x2 เป็นฟีเจอร์ข้าม
ไม่ช่วยแก้ไขปัญหา)
-
การลดอัตราการเรียนรู้ อาจเป็น 0.001
คลิกไอคอนเครื่องหมายบวกเพื่อดูคําตอบของคําถามที่ 3
พื้นผิวเอาต์พุตของโมเดลไม่เหมือนรูปแบบเชิงเส้น แต่จะเห็นเครื่องเดินวงรี