Sınıflandırma: Eşik

Lojistik regresyon bir olasılığı döndürür. Döndürülen olasılığı olduğu gibi kullanabilirsiniz (örneğin, kullanıcının bu reklamı tıklama olasılığı 0.00023'tür) veya döndürülen olasılığı ikili değere dönüştürebilirsiniz (örneğin, bu e-posta spam).

Belirli bir e-posta iletisi için 0,9995 değerini döndüren lojistik regresyon modeli, bunun spam olma ihtimalinin çok yüksek olduğunu tahmin eder. Öte yandan, aynı lojistik regresyon modelinde tahmin puanı 0,0003 olan başka bir e-posta iletisi büyük olasılıkla spam değildir. Peki, 0,6 tahmin puanına sahip bir e-posta iletisi ne olacak? Lojistik regresyon değerini bir ikili kategoriyle eşlemek için bir sınıflandırma eşiği (karar eşiği olarak da adlandırılır) tanımlamanız gerekir. Bu eşiğin üzerindeki bir değer "spam"i belirtir. Aşağıdaki değer de "spam değil"i belirtir. Sınıflandırma eşiğinin her zaman 0,5 olması gerektiğini varsayarak, eşik değerleri soruna bağlı olduğundan ayarlamanız gereken değerler olduğunu varsayar.

Aşağıdaki bölümlerde, bir sınıflandırma modelinin tahminlerini değerlendirmek için kullanabileceğiniz metriklerin yanı sıra sınıflandırma eşiğini bu tahminler üzerinde değiştirmenin etkisi daha yakından incelenmektedir.