סיווג: סף

רגרסיה לוגיסטית מחזירה הסתברות. תוכלו להשתמש בהסתברות המוחזרת כפי שהיא &&

מודל רגרסיה לוגיסטי שמחזיר 0.9995 עבור הודעת אימייל מסוימת, חוזה שסביר מאוד להניח שהיא ספאם. לעומת זאת, סביר להניח שהודעת אימייל נוספת עם ציון חיזוי של 0.0003 באותו מודל רגרסיה לוגיסטי לא ספאם. עם זאת, מה לגבי הודעת אימייל שציון החיזוי שלה הוא 0.6? כדי למפות ערך רגרסיה לוגיסטי לקטגוריה בינארית, צריך להגדיר סף לסיווג (שנקרא גם סף לקבלת החלטה). ערך מעל לסף זה מציין "spam"; ערך למטה מציין " לא ספאם." המפתה להניח שסף הסיווג צריך להיות תמיד 0.5, אבל ערכי הסף תלויים בבעיה, ולכן הערכים צריכים להיות ספציפיים.

הקטעים הבאים בוחנים לעומק מדדים שבהם ניתן להשתמש כדי להעריך את מודל הסיווג ואת ההשפעה של שינוי סף הסיווג על החיזויים האלה.