ดูตัวเลือกด้านล่าง

สมมติว่าคุณต้องการพัฒนาโมเดลแมชชีนเลิร์นนิงที่มีการควบคุมดูแลเพื่อคาดคะเนว่าอีเมลหนึ่งๆ เป็น "จดหมายขยะ" หรือ "ไม่ใช่สแปม" ข้อความใดต่อไปนี้เป็นจริง
อีเมลที่ไม่มีการทําเครื่องหมายว่าเป็น "สแปม" หรือ "ไม่ใช่สแปม" เป็นตัวอย่างที่ไม่มีป้ายกํากับ
เนื่องจากตัวอย่างป้ายกํากับของเราประกอบด้วยค่า "spam" และ "notที่เป็นสแปม" อีเมลใดๆ ก็ตามที่ไม่ได้ทําเครื่องหมายว่าเป็นจดหมายขยะหรือไม่ใช่สแปมเป็นตัวอย่างที่ไม่มีป้ายกํากับ
คําในส่วนหัวของหัวข้อจะสร้างป้ายกํากับที่ดี
คําในส่วนหัวของหัวข้ออาจมีฟีเจอร์ที่ยอดเยี่ยม แต่คําเหล่านี้จะไม่สร้างป้ายกํากับที่ดี
เราจะใช้ตัวอย่างที่ไม่มีป้ายกํากับเพื่อฝึกโมเดล
เราจะใช้ตัวอย่างที่ติดป้ายกํากับเพื่อฝึกโมเดล จากนั้นเราจะสามารถ ฝึกโมเดลจากตัวอย่างที่ไม่มีป้ายกํากับ เพื่ออนุมานว่าข้อความอีเมลที่ไม่มีป้ายกํากับเป็นสแปมหรือไม่
ป้ายกํากับที่ใช้กับตัวอย่างบางรายการอาจไม่น่าเชื่อถือ
แน่นอน คุณควรตรวจสอบว่าข้อมูลมีความน่าเชื่อถือมากน้อยเพียงใด ป้ายกํากับสําหรับชุดข้อมูลนี้อาจมาจากผู้ใช้อีเมลที่ทําเครื่องหมายอีเมลว่าเป็นจดหมายขยะ เนื่องจากผู้ใช้ส่วนใหญ่ไม่ได้ทําเครื่องหมายข้อความอีเมลที่น่าสงสัยทั้งหมดว่าเป็นจดหมายขยะ เราอาจมีปัญหาในการทราบว่าอีเมลเป็นจดหมายขยะหรือไม่ นอกจากนี้ นักส่งสแปมอาจจงใจทําให้โมเดลของคุณเป็นพิษด้วยการระบุป้ายกํากับที่ไม่ถูกต้อง