การจัดประเภท: การกําหนดเกณฑ์ขั้นต่ํา

การถดถอยแบบโลจิสติกส์จะแสดงผลความน่าจะเป็น คุณสามารถใช้ความน่าจะเป็นที่ส่งกลับ " ตามที่มีอยู่ (เช่น ความน่าจะเป็นที่ผู้ใช้จะคลิกโฆษณานี้คือ 0.00023) หรือแปลงความน่าจะเป็นที่แสดงผลนั้นเป็นค่าไบนารี (เช่น อีเมลนี้เป็นสแปม)

รูปแบบการถดถอยแบบโลจิสติกส์ที่แสดงค่า 0.9995 สําหรับข้อความอีเมลหนึ่งๆ กําลังคาดการณ์อยู่ว่ามีแนวโน้มสูงมากที่จะเป็นสแปม ในทางกลับกัน ข้อความอีเมลอีกฉบับที่มีคะแนนการคาดการณ์ 0.0003 ในรูปแบบการถดถอยแบบโลจิสติกส์เดียวกันนั้นมีแนวโน้มที่จะไม่ใช่สแปม แต่สําหรับข้อความอีเมลที่มีคะแนนการคาดการณ์เป็น 0.6 ล่ะ หากต้องการแมปค่าการถดถอยแบบโลจิสติกส์กับหมวดหมู่ไบนารี คุณต้องกําหนดเกณฑ์การจัดประเภท (หรือที่เรียกว่าเกณฑ์การตัดสินใจ) ค่าที่สูงกว่าเกณฑ์ดังกล่าวระบุ "สแปม" ค่าด้านล่างบ่งชี้ว่า "ไม่ใช่สแปม" คุณอยากจะสรุปว่าเกณฑ์การจัดประเภทควรเป็น 0.5 เสมอ แต่เกณฑ์จะขึ้นอยู่กับปัญหา และค่าที่คุณต้องได้รับการปรับแต่ง

ส่วนต่อไปนี้จะอธิบายเมตริกต่างๆ ที่คุณใช้ประเมินโมเดลการจัดประเภทได้อย่างละเอียดยิ่งขึ้น รวมถึงผลกระทบจากการเปลี่ยนแปลงเกณฑ์การจัดประเภทที่มีต่อการคาดการณ์เหล่านี้