Classificação: precisão e recall

Precisão

A precisão tenta responder à seguinte pergunta:

Qual a proporção de identificações positivas estava correta?

A precisão é definida da seguinte maneira:

$$\text{Precision} = \frac{TP}{TP+FP}$$

Vamos calcular a precisão do nosso modelo de ML na seção anterior que analisa tumores:

Verdadeiros positivos (VPs): 1 Falsos positivos (FPs): 1
Falsos negativos (FNs): 8 Verdadeiros negativos (VNs): 90
$$\text{Precision} = \frac{TP}{TP+FP} = \frac{1}{1+1} = 0.5$$

Nosso modelo tem uma precisão de 0,5.Em outras palavras, quando prevê que um tumor é maligno, é correto em 50% do tempo.

Recall

O recall tenta responder à seguinte pergunta:

Qual proporção de positivos verdadeiros foi identificada corretamente?

Matematicamente, o recall é definido da seguinte forma:

$$\text{Recall} = \frac{TP}{TP+FN}$$

Vamos calcular o recall do nosso classificador de tumor:

Verdadeiros positivos (VPs): 1 Falsos positivos (FPs): 1
Falsos negativos (FNs): 8 Verdadeiros negativos (VNs): 90
$$\text{Recall} = \frac{TP}{TP+FN} = \frac{1}{1+8} = 0.11$$

Nosso modelo teve um recall de 0,11.Em outras palavras, identifica corretamente 11% de todos os tumores malignos.

Precisão e recall: um combate

Para avaliar totalmente a eficácia de um modelo, é necessário examinar ambos a precisão e o recall. Infelizmente, a precisão e o recall geralmente estão sobrecarregados. Ou seja, melhorar a precisão geralmente reduz o recall e vice-versa. Explore essa ideia analisando a figura a seguir, que mostra 30 previsões feitas por um modelo de classificação de e-mail. Aquelas à direita do limite de classificação são classificadas como spam, enquanto aquelas à esquerda são classificadas como spam, não.

Uma linha numérica de 0 a 1,0 em que 30 exemplos foram inseridos.

Figura 1. classificar mensagens de e-mail como spam ou não.

Vamos calcular a precisão e o recall com base nos resultados mostrados na Figura 1:

Verdadeiros positivos (VP): 8 Falsos positivos (FP): 2
Falsos negativos (FN): 3 Verdadeiros negativos (VN): 17

A precisão mede a porcentagem de e-mails sinalizados como spam que foram classificados corretamente, ou seja, a porcentagem de pontos à direita da linha de limite que é verde na Figura 1:

$$\text{Precision} = \frac{TP}{TP + FP} = \frac{8}{8+2} = 0.8$$

O recall mede a porcentagem de e-mails de spam reais que foram classificados corretamente, ou seja, a porcentagem de pontos verdes à direita da linha de limite na Figura 1:

$$\text{Recall} = \frac{TP}{TP + FN} = \frac{8}{8 + 3} = 0.73$$

A Figura 2 ilustra o efeito de aumento do limite de classificação.

Mesmo conjunto de exemplos, mas com aumento do limite de classificação. 2 dos 30 exemplos foram reclassificados.

Figura 2. Aumentar o limite de classificação.

O número de falsos positivos diminui, mas os falsos negativos aumentam. Como resultado, a precisão aumenta, enquanto o recall diminui:

Verdadeiros positivos (VP): 7 Falsos positivos (FP): 1
Falsos negativos (FN): 4 Verdadeiros negativos (VN): 18
$$\text{Precision} = \frac{TP}{TP + FP} = \frac{7}{7+1} = 0.88$$ $$\text{Recall} = \frac{TP}{TP + FN} = \frac{7}{7 + 4} = 0.64$$

Por outro lado, a Figura 3 ilustra o efeito de diminuição do limite de classificação (da posição original na Figura 1).

Mesmo conjunto de exemplos, mas com limite de classificação reduzido.

Figura 3. Diminuindo o limite de classificação.

Os falsos positivos aumentam e os falsos negativos diminuem. Como resultado, dessa vez, a precisão diminui e o recall aumenta:

Verdadeiros positivos (VP): 9 Falsos positivos (FP): 3
Falsos negativos (FN): 2 Verdadeiros negativos (VN): 16
$$\text{Precision} = \frac{TP}{TP + FP} = \frac{9}{9+3} = 0.75$$ $$\text{Recall} = \frac{TP}{TP + FN} = \frac{9}{9 + 2} = 0.82$$

Diversas métricas foram desenvolvidas que dependem da precisão e do recall. Por exemplo, consulte Pontuação F1.