Redes neurais multiclasse: um vs. todos

Um x todos fornece uma maneira de aproveitar a classificação binária. Dado um problema de classificação em N possíveis soluções, uma solução de um para todos consiste em N classificadores binários separados, um classificador binário para cada resultado possível. Durante o treinamento, o modelo executa uma sequência de classificadores binários, treinando cada um para responder a uma pergunta de classificação separada. Por exemplo, considerando a imagem de um cachorro, cinco reconhecedores diferentes podem ser treinados, quatro vendo a imagem como um exemplo negativo (não uma maçã, não um urso etc.) e um vendo a imagem como um exemplo positivo (um cachorro). Ou seja:

  1. Esta imagem é uma maçã? Número
  2. Esta imagem é um urso? Número
  3. Esta imagem é doce? Número
  4. Esta imagem é um cachorro? Sim.
  5. Esta imagem é um ovo? Número

Essa abordagem é razoavelmente razoável quando o número total de classes é pequeno, mas torna-se cada vez mais ineficiente à medida que o número de classes aumenta.

É possível criar um modelo de um em relação a todos significativamente mais eficiente com uma rede neural profunda, em que cada nó de saída representa uma classe diferente. A figura a seguir sugere essa abordagem:

Uma rede neural com cinco camadas de saída e cinco ocultas.

Figura 1. Uma rede neural 1 em comparação a todas.