Clasificación: Verdadero o falso y positivo o negativo

En esta sección, definiremos los componentes básicos de las métricas que usaremos para evaluar los modelos de clasificación. Pero primero, una fábula:

Fábula de Esopo: El niño que gritó lobo (comprimido)

Un joven pastor se aburre de cuidar el rebaño del pueblo Para divertirse, grita, "¡Lobo!", a pesar de que no hay un lobo a la vista. Los vecinos corren para proteger el rebaño, pero se enojan mucho cuando se dan cuenta de que el niño les estaba bromeando.

[Repite el párrafo anterior N veces].

Una noche, el joven pastor ve un lobo real acercándose al rebaño y grita: "¡Lobo!". Los vecinos se niegan a ser engañados otra vez y se quedan en sus casas. El hambriento lobo convierte el rebaño en cortes de cordero. El pueblo está hambriento. Se produce un pánico.

Hagamos las siguientes definiciones:

  • "Lobo" es una clase positiva.
  • Ningún lobo es una clase negativa.

Podemos resumir nuestro modelo de "predicción de lobos" con una matriz de confusión de 2 x 2 que muestra los cuatro resultados posibles:

Verdadero positivo (VP):
  • Realidad: Un lobo amenazado.
  • El pastor dijo: "Lobo".
  • Resultado: El pastor es un héroe.
Falso positivo (FP):
  • Realidad: Ningún lobo está amenazado.
  • El pastor dijo: "Lobo".
  • Resultado: Los vecinos están enojados con el pastor por despertarlos.
Falso negativo (FN):
  • Realidad: Un lobo amenazado.
  • El pastor dijo: "No hay un lobo".
  • Resultado: El lobo se comió todas las ovejas.
Verdadero negativo (VN):
  • Realidad: Ningún lobo está amenazado.
  • El pastor dijo: "No hay un lobo".
  • Resultado: Todos están bien.

Un verdadero positivo es un resultado en el que el modelo predice correctamente la clase positiva. De manera similar, un verdadero negativo es un resultado en el que el modelo predice correctamente la clase negativa.

Un falso positivo es un resultado en el que el modelo predice de manera incorrecta la clase positiva. Y un falso negativo es un resultado en el que el modelo predice incorrectamente la clase negativa.

En las siguientes secciones, veremos cómo evaluar los modelos de clasificación mediante métricas derivadas de estos cuatro resultados.