분류: 기준점

로지스틱 회귀는 확률을 반환합니다. 반환된 확률을 사용(예: 사용자가 이 광고를 클릭할 확률은 0.00023)하거나 반환된 확률을 바이너리 값 (예: 스팸인 이메일)으로 변환할 수 있습니다.

로지스틱 회귀 모델이 특정 이메일 메시지에 대해 0.9995를 반환하면 스팸일 가능성이 매우 높습니다. 반대로 동일한 로지스틱 회귀 모델에서 예측 점수가 0.0003점인 다른 이메일은 스팸이 아닐 가능성이 높습니다. 하지만 예측 점수가 0.6인 이메일 메시지는 어떨까요? 로지스틱 회귀 값을 이진 카테고리에 매핑하려면 분류 임곗값(결정 임곗값이라고도 함)을 정의해야 합니다. 이 값을 초과하는 값은 '스팸'; 아래의 값이 '스팸이 아님'을 나타냅니다. 분류 임곗값은 항상 0.5여야 한다고 생각하기 쉽지만 임곗값은 문제에 따라 달라지므로 조정해야 하는 값입니다.

다음 섹션에서는 분류 모델의 예측을 평가하는 데 사용할 수 있는 측정항목과 분류 임곗값을 변경할 때 이러한 예측에 미치는 영향을 자세히 살펴봅니다.