Redes neurais multiclasse

Anteriormente, você encontrou modelos de classificação binária que podem escolher entre uma duas opções possíveis, por exemplo:

  • Um e-mail é spam ou não é spam.
  • Um determinado tumor é maligno ou benigno.

Neste módulo, vamos analisar a classificação multiclasse, que pode escolher entre várias possibilidades. Exemplo:

  • Este cachorro é um beagle, um baço ou um galgo?
  • Esta flor é uma Íris siberiana, íris holandesa, íris de bandeira azul ou uma íris de barba anão?
  • Este avião é um Boeing 747, Airbus 320, Boeing 777 ou Embraer 190?
  • Esta é uma imagem de uma maçã, urso, doces, cachorros ou ovos?

Alguns problemas reais de várias classes envolvem a escolha de milhões de classes separadas. Por exemplo, considere um modelo de classificação multiclasse que pode identificar a imagem de quase tudo.

Redes neurais multiclasse

  • A regressão logística oferece probabilidades úteis para problemas de classe binária.
    • spam / não é spam
    • clique / não clique
  • E os problemas multiclasse?
    • maçã, banana, carro, cardiologista, ..., placa de caminhada, zebra, zoológico
    • vermelho, laranja, amarelo, verde, azul, anil, violeta
    • animal, vegetal, mineral
  • Crie uma saída única para cada classe possível
  • Treinar em um sinal de "minha classe" em comparação a "todas as outras classes"
  • Pode fazer em uma rede profunda ou com modelos separados
Uma rede neural com cinco camadas escondidas e cinco camadas de saída.
  • Adicione outra restrição: exigir a saída de todos os nós de um para todos para somar 1,0
  • A restrição adicional ajuda a convergir rapidamente para o treinamento
  • Além disso, permite que as saídas sejam interpretadas como probabilidades
Uma rede neural profunda com uma camada de entrada, duas camadas ocultas não descritivas, uma camada Softmax e, por fim, uma camada de saída com o mesmo número de nós que a camada Softmax.
  • Classificação de multiclasse e de rótulo único:
    • Um exemplo pode ser membro de apenas uma classe.
    • A restrição de que as classes são mutuamente exclusivas é uma estrutura útil.
    • É útil para codificar esse valor na perda.
    • Use uma perda softmax para todas as classes possíveis.
  • Classificação multiclasse e multimarcador:
    • Um exemplo pode ser membro de mais de uma classe.
    • Nenhuma restrição adicional sobre a associação a classes para explorar.
    • Uma perda de regressão logística para cada classe possível.
  • SoftMax completo
    • Força bruta; calcula para todas as classes.
  • SoftMax completo
    • Força bruta; calcula para todas as classes.
  • Amostragem de candidatos
    • Calcula para todos os rótulos positivos, mas apenas para uma amostra aleatória de negativos.