Redes neuronales de clases múltiples

Anteriormente, encontraste modelos de clasificación binaria que podían elegir una de dos opciones posibles, por ejemplo:

  • Un correo electrónico determinado es spam o no es spam.
  • Un tumor dado es maligno o benigno.

En este módulo, investigaremos la clasificación multiclase, que puede elegir entre varias posibilidades. Por ejemplo:

  • ¿Este perro es un beagle, un basset hound o un sabueso?
  • ¿Esta flor es una iris sibirica, holandesa, con bandera azul o con barba enana?
  • ¿Ese avión es un Boeing 747, un Airbus 320, un Boeing 777 o un Embraer 190?
  • ¿Esta es la imagen de una manzana, un oso, una golosina, un perro o un huevo?

Algunos problemas de clases múltiples del mundo real implican elegir entre millones de clases separadas. Por ejemplo, considera un modelo de clasificación de clases múltiples que pueda identificar la imagen de casi cualquier cosa.

Redes neuronales de clases múltiples

  • La regresión logística proporciona probabilidades útiles para los problemas de clase binaria.
    • spam / no es spam
    • clic / no clic
  • ¿Qué sucede con los problemas de varias clases?
    • manzana, banana, automóvil, cardiólogo, ..., señal de tránsito, cebra, zoológico
    • rojo, naranja, amarillo, verde, azul, índigo, violeta
    • animal, vegetal, mineral
  • Crea un resultado único para cada clase posible
  • Entrena eso en una señal de "mi clase" en comparación con "todas las demás clases"
  • Se puede hacer en una red profunda o con modelos separados
Una red neuronal con cinco capas ocultas y cinco capas de salida
  • Agrega una restricción adicional: Exige que la suma de todos los nodos de uno frente a todos sea igual a 1.0
  • La restricción adicional ayuda a que el entrenamiento converja rápidamente
  • Además, permite que los resultados se interpreten como probabilidades.
Una red neuronal profunda con una capa de entrada, dos capas ocultas indefinidas, una capa de softmax y, finalmente, una capa de salida con la misma cantidad de nodos que la capa de softmax
  • Clasificación de una sola etiqueta en clases múltiples:
    • Un ejemplo puede ser un miembro de una sola clase.
    • La restricción de que las clases son mutuamente excluyentes es una estructura útil.
    • Es útil para codificar esto en la pérdida.
    • Usa una pérdida de softmax para todas las clases posibles.
  • Clasificación de varias etiquetas en clases múltiples:
    • Un ejemplo puede ser un miembro de más de una clase.
    • No hay restricciones adicionales para aprovecharse de la pertenencia a una clase.
    • Una pérdida de regresión logística para cada clase posible.
  • softmax completo
    • Fuerza bruta; calcula para todas las clases.
  • softmax completo
    • Fuerza bruta; calcula para todas las clases.
  • Muestreo de candidatos
    • Calcula para todas las etiquetas positivas, pero solo para una muestra aleatoria de negativos.