בקטע הקודם הוצגה קבוצה של מדדי מודל, שכוללים חישוב לפי ערך סף יחיד של סיווג. עם זאת, אם רוצים להעריך את איכות המודל בכל הערכים האפשריים של הסף, צריך להשתמש בכלים אחרים.
עקומת מאפייני המקבל (ROC)
העקומה של ROC היא ייצוג חזותי של ביצועי המודל בכל הערוצים. הגרסה הארוכה של השם, 'מאפיין הפעולה של מקלט', היא שריד מגילוי מכשירי מכ"ם במלחמת העולם השנייה.
כדי לצייר את עקומת ROC, מחשבים את שיעור החיובים האמיתיים (TPR) ואת שיעור החיובים הכוזבים (FPR) בכל סף אפשרי (בפועל, במרווחים נבחרים), ולאחר מכן מייצגים את TPR בתרשים מעל FPR. מודל מושלם, שבסף מסוים יש לו ערך TPR של 1.0 וערך FPR של 0.0, יכול להיות מיוצג על ידי נקודה ב-(0, 1) אם מתעלמים מכל שאר הספים, או על ידי הנתונים הבאים:

שטח מתחת לעקומה (AUC)
השטח מתחת לעקומת ROC (AUC) מייצג את ההסתברות שהמודל, אם יתקבלו לו דוגמה חיובית ודוגמה שלילית שנבחרו באקראי, ידרג את הדוגמה החיובית גבוה יותר מהדוגמה השלילית.
שטח מתחת לעקומה (AUC) של המודל המושלם שלמעלה, שמכיל ריבוע עם צלעות באורך 1, הוא 1.0. המשמעות היא שיש סבירות של 100% שהמודל ידרג בצורה נכונה דוגמה חיובית שנבחרה באופן אקראי גבוה יותר מדוגמה שלילית שנבחרה באופן אקראי. במילים אחרות, בהתאם להפצה של נקודות הנתונים שבהמשך, AUC מאפשר לחשב את ההסתברות שהמודל יניח ריבוע שנבחר באופן אקראי מימין לעיגול שנבחר באופן אקראי, ללא קשר למיקום שבו מוגדר הסף.
באופן קונקרטי יותר, למסווג ספאם עם AUC של 1.0 תמיד תהיה סבירות גבוהה יותר להגדיר אימייל ספאם אקראי כספאם מאשר אימייל לגיטימי אקראי. הסיווג בפועל של כל הודעת אימייל תלוי בערך הסף שתבחרו.
למסווג בינארי, מודל שמניב תוצאות זהות לאלה של ניחושים אקראיים או של הטלת מטבע הוא מודל עם עקומת ROC שמהווה קו אלכסוני מ-(0,0) ל-(1,1). ערך AUC הוא 0.5, והוא מייצג סיכוי של 50% לדירוג נכון של דוגמה חיובית ושלילית אקראיות.
בדוגמה של סיווג ספאם, לסיווג ספאם עם AUC של 0.5 יש רק חצי מהזמן סבירות גבוהה יותר להקצות להודעת אימייל אקראית שסווגה כספאם את הסיווג 'ספאם' מאשר להקצות את הסיווג הזה להודעת אימייל אקראית שסווגה כחוקית.

(אופציונלי, מתקדם) עקומת דיוק-זיהוי
אפשר להשתמש ב-AUC וב-ROC כדי להשוות בין מודלים כשמערך הנתונים מאוזן באופן יחסי בין הכיתות. כשמערך הנתונים לא מאוזן, עקומות של רמת דיוק-רמת זיהוי (PRC) והאזור שמתחת לעקומות האלה עשויים לספק תצוגה חזותית השוואתית טובה יותר של ביצועי המודל. כדי ליצור עקומות של רמת דיוק-רמת זיהוי, מתארכים את רמת הדיוק בציר ה-Y ואת רמת הזיהוי בציר ה-X בכל ערכי הסף.

AUC ו-ROC לבחירת מודל וסף
AUC הוא מדד שימושי להשוואה בין הביצועים של שני מודלים שונים, כל עוד מערך הנתונים מאוזן באופן יחסי. בדרך כלל, המודל עם שטח גדול יותר מתחת לקו הוא המודל הטוב יותר.


הנקודות על עקומת ROC הקרובות ביותר ל-(0,1) מייצגות טווח של ערכי הסף עם הביצועים הטובים ביותר במודל הנתון. כפי שמוסבר בקטעים סף, מטריצה של בלבול ובחירת מדד ומאזני עלויות-תועלות, הסף שבוחרים תלוי במדד שהכי חשוב לתרחיש לדוגמה הספציפי. נבחן את הנקודות A, B ו-C בתרשים הבא, שכל אחת מהן מייצגת ערך סף:

אם תוצאות חיוביות שגויות (התראות שווא) הן בעלות גבוהה מאוד, מומלץ לבחור ערך סף שמניב ערך FPR נמוך יותר, כמו הערך בנקודה A, גם אם ערך ה-TPR יורד. לעומת זאת, אם תוצאות חיוביות מטעות זולות ותוצאות שליליות מטעות (החמצת תוצאות חיוביות אמיתיות) יקרות מאוד, עדיף להשתמש בערך הסף של הנקודה C, שממקסם את הערך של TPR. אם העלויות דומות, נקודת B עשויה לספק את האיזון הטוב ביותר בין שיעור ההמרות לבין שיעור הפסילות.
זוהי עקומת ROC של הנתונים שראינו קודם:
תרגול: בדיקת ההבנה








(אופציונלי, מתקדם) שאלה כבונוס
נניח מצב שבו עדיף לאפשר לספאם מסוים להגיע לתיבת הדואר הנכנס, מאשר לשלוח אימייל קריטי לעסק לתיקיית הספאם. הכשרתם סיווג ספאם למצב הזה, שבו הכיתה החיובית היא ספאם והכיתה השלילית היא לא ספאם. איזה מהנקודות הבאות בתרשים ROC של הסיווג עדיף?
