Phân loại: Ngưỡng

Hồi quy logistic trả về xác suất. Bạn có thể sử dụng xác suất được trả về "là

Một mô hình hồi quy logistic trả về 0,9995 cho một email cụ thể đang dự đoán rằng đó rất có thể là thư rác. Ngược lại, một email khác có điểm dự đoán là 0,0003 trên cùng một mô hình hồi quy logistic rất có thể sẽ không phải là thư rác. Tuy nhiên, tin nhắn email có điểm dự đoán là 0,6 thì sao? Để liên kết một giá trị hồi quy logistic với một danh mục nhị phân, bạn phải xác định ngưỡng phân loại (còn gọi là ngưỡng quyết định). Giá trị trên ngưỡng đó cho biết "spam"; giá trị bên dưới cho biết "không phải spam." Bạn nên giả định rằng ngưỡng phân loại phải luôn là 0.5, nhưng các ngưỡng sẽ phụ thuộc vào vấn đề và do đó, là các giá trị mà bạn phải điều chỉnh.

Các phần sau đây sẽ xem xét kỹ hơn các chỉ số mà bạn có thể sử dụng để đánh giá thông tin dự đoán của mô hình phân loại, cũng như tác động của việc thay đổi ngưỡng phân loại trên các thông tin dự đoán đó.