Regressão logística: como calcular uma probabilidade

Muitos problemas exigem uma estimativa de probabilidade como saída. A regressão logística é um mecanismo extremamente eficiente para calcular probabilidades. Na prática, é possível usar a probabilidade retornada de uma destas duas maneiras:

  • "Como está"
  • Convertido para uma categoria binária.

Vamos analisar como podemos usar a probabilidade "no estado em que se encontram." Suponha que criemos um modelo de regressão logística para prever a probabilidade de um cachorro latir durante a noite. Vamos chamá-lo de probabilidade:

\[p(bark | night)\]

Se o modelo de regressão logística previr \(p(bark | night) = 0.05\), ao longo de um ano, os proprietários dos cães precisarão ser acordados aproximadamente 18 vezes:

\[\begin{align} startled &= p(bark | night) \cdot nights \\ &= 0.05 \cdot 365 \\ &~= 18 \end{align} \]

Em muitos casos, você mapeará a saída da regressão logística na solução para um problema de classificação binária em que o objetivo é prever corretamente um dos dois rótulos possíveis (por exemplo, "spam" ou "não é spam"). Um próximo módulo se concentra nisso.

Você pode estar se perguntando como um modelo de regressão logística pode garantir uma saída que sempre fique entre 0 e 1. Como acontece, uma função sigmoide, definida a seguir, produz um resultado com as mesmas características:

$$y = \frac{1}{1 + e^{-z}}$$

A função sigmoide gera o seguinte gráfico:

Função sigmoide. O eixo X é o valor bruto de inferência. O eixo y estende-se de 0 a +1, exclusivo.

Figura 1: função sigmoide.

Se \(z\) representar a saída da camada linear de um modelo treinado com regressão logística, \(sigmoid(z)\) vai gerar um valor (uma probabilidade) entre 0 e 1. Em termos matemáticos:

$$y' = \frac{1}{1 + e^{-z}}$$

onde:

  • \(y'\) é a saída do modelo de regressão logística de um exemplo específico.
  • \(z = b + w_1x_1 + w_2x_2 + \ldots + w_Nx_N\)
    • Os valores \(w\) são os pesos aprendidos do modelo, e \(b\) é o viés.
    • Os valores \(x\) são os valores de recurso de um exemplo específico.

Observe que \(z\) também é conhecido como log-odds, porque o inverso dos sigmoides \(z\) pode ser definido como o registro da probabilidade do rótulo \(1\) (por exemplo, "latidos de cachorro") dividido pela probabilidade do identificador \(0\)(por exemplo, "cachorro não/#39;não latir"):

$$ z = \log\left(\frac{y}{1-y}\right) $$

Veja a função sigmoide com identificadores de ML:

A função sigmoide com o eixo x denominada como a soma de todos os pesos e atributos (mais o viés). O eixo y é denominado Saída de probabilidade.

Figura 2: saída da regressão logística.