분류: 참 대 허위, 양성 대 음성

이 섹션에서는 분류 모델 평가에 사용할 측정항목의 기본 토대를 정의합니다. 먼저 우화를 하나 살펴보겠습니다.

이솝 우화: 양치기 소년(요약본)

양치기 소년이 마을의 양떼를 돌보던 중 심심해졌습니다. 소년은 늑대가 보이지 않았지만 재미로 "늑대다!"라고 외쳤습니다. 마을 사람들은 양떼를 지키려고 뛰어왔지만 소년이 장난친 것을 알고는 몹시 화가 났습니다.

[이전 단락을 N번 반복합니다.]

어느 날 밤 양치기 소년은 양떼를 향해 다가오는 진짜 늑대를 보고 "늑대다!"라고 외칩니다. 하지만 마을 사람들은 소년이 다시 거짓말을 한다고 생각해서 집에서 나오지 않습니다. 배고픈 늑대는 양들을 다 잡아먹습니다. 마을은 가난해지고 혼란은 계속됩니다.

다음과 같이 정의해 보겠습니다.

  • "늑대다"는 양성 클래스입니다.
  • "늑대가 없다"는 네거티브 클래스입니다.

'늑대 예측' 모델에서 발생할 수 있는 4가지 결과를 요약하면 다음과 같이 2x2 혼동행렬을 사용해 나타낼 수 있습니다.

참양성(TP):
  • 현실: 늑대의 위협이 있었습니다.
  • 양치기의 외침: "늑대다."
  • 결과: 양치기는 영웅입니다.
허위 양성(FP):
  • 현실: 늑대의 위협이 없었습니다.
  • 양치기의 외침: "늑대다."
  • 결과: 마을 사람들은 양치기가 잠을 깨워서 화가 났습니다.
허위 음성(FN):
  • 현실: 늑대의 위협이 있었습니다.
  • 양치기의 외침: "늑대가 없다."
  • 결과: 늑대가 양들을 모두 잡아먹었습니다.
참 음성(TN):
  • 현실: 늑대의 위협이 없었습니다.
  • 양치기의 외침: "늑대가 없다."
  • 결과: 모두가 괜찮습니다.

참양성은 모델에서 포지티브 클래스를 정확하게 평가하는 결과입니다. 마찬가지로 참음성은 모델에서 네거티브 클래스를 정확하게 평가하는 결과입니다.

거짓양성은 모델에서 포지티브 클래스를 잘못 예측한 결과입니다. 거짓음성은 모델에서 네거티브 클래스를 잘못 예측한 결과입니다.

다음 섹션에서는 이 4개의 결과에서 파생된 측정항목을 사용하여 분류 모델을 평가하는 방법을 살펴보겠습니다.