Clasificación: Verdadero o falso y positivo o negativo

En esta sección, definiremos los componentes básicos de las métricas que utilizaremos para evaluar modelos de clasificación. Pero primero, una fábula:

Fábula de Esopo: El joven y el lobo (versión comprimida)

Un joven pastor se aburre de cuidar el rebaño del pueblo y, para divertirse, grita: "¡Lobo!", aunque no hay ningún lobo a la vista. Los vecinos corren para proteger el rebaño, pero se enojan mucho al descubrir que el joven solo estaba bromeando.

[Repite el párrafo anterior N veces].

Una noche, el joven pastor ve un lobo real acercándose al rebaño y grita: "¡Lobo!". Los vecinos se niegan a ser engañados otra vez y se quedan en sus casas. El hambriento lobo convierte el rebaño en costillas de cordero. El pueblo comienza a sentirse hambriento. A continuación, se desata el pánico.

Hagamos las siguientes definiciones:

  • "Lobo" es una clase positiva.
  • "Ningún lobo" es una clase negativa.

Podemos resumir nuestro modelo "predicción de lobos" con una matriz de confusión de 2x2 que muestra los cuatro resultados posibles:

Verdadero positivo (VP):
  • Realidad: La amenaza de un lobo.
  • El pastor dijo: "Lobo".
  • Resultado: El pastor es un héroe.
Falso positivo (FP):
  • Realidad: No hay amenaza de un lobo.
  • El pastor dijo: "Lobo".
  • Resultado: Los vecinos están enojados con el pastor por despertarlos.
Falso negativo (FN):
  • Realidad: La amenaza de un lobo.
  • El pastor dijo: "No hay un lobo".
  • Resultado: El lobo se comió todas las ovejas.
Verdadero negativo (VN):
  • Realidad: No hay amenaza de un lobo.
  • El pastor dijo: "No hay un lobo".
  • Resultado: Todos están bien.

Un verdadero positivo es un resultado en el que el modelo predice correctamente la clase positiva. De manera similar, un verdadero negativo es un resultado en el que el modelo predice correctamente la clase negativa.

Un falso positivo es un resultado en el que el modelo predice incorrectamente la clase positiva. Y un falso negativo es un resultado en el que el modelo predice incorrectamente la clase negativa.

En las siguientes secciones, observaremos cómo evaluar los modelos de clasificación con métricas derivadas de estos cuatro resultados.