Redes neuronales de clases múltiples

Anteriormente, presentamos modelos de clasificación binaria que podían elegir una de dos opciones posibles, como en los siguientes casos:

  • Un correo electrónico dado "es spam" o "no es spam".
  • Un tumor dado es "maligno" o "benigno".

En este módulo, investigaremos la clasificación de clases múltiples, que puedes elegir entre posibilidades múltiples. Por ejemplo:

  • ¿Este perro es un beagle, un basset hound o un sabueso?
  • ¿Esta flor es una iris sibirica, hollandica, versicolor o setosa?
  • ¿Ese avión es un Boeing 747, un Airbus 320, un Boeing 777 o un Embraer 190?
  • ¿Esta es la imagen de una manzana, un oso, un dulce, un perro o un huevo?

Algunos problemas de clases múltiples del mundo real implican elegir entre millones de clases individuales. Por ejemplo, supongamos un modelo de clasificación de clases múltiples que pueda identificar la imagen de lo que fuera.

Redes neuronales de clases múltiples

¿Hay más de dos clases?

  • La regresión logística arroja probabilidades útiles para los problemas de clase binaria.
    • es spam/no es spam
    • se hizo clic/no se hizo clic
  • ¿Qué sucede con los problemas de clases múltiples?
    • manzana, banana, automóvil, cardiólogo, ..., señal de peatón, cebra, zoológico
    • rojo, naranja, amarillo, verde, azul, índigo, violeta
    • animal, vegetal, mineral

Clases múltiples de uno frente a todos

  • Crea un resultado único para cada clase posible.
  • Entrena una señal de "mi clase" frente a "las demás clases".
  • Puede hacerse en una red amplia o con modelos independientes.
Una red neural con cinco capas ocultas y cinco capas de resultado

Clases múltiples de softmax

  • Agrega una restricción adicional: Requiere un resultado de todos los nodos de uno frente a todos para sumar 1.0.
  • La restricción adicional permite entrenar la convergencia rápidamente.
  • Además, permite interpretar los resultados como probabilidades.
Una red neuronal profunda con una capa de entrada, dos capas ocultas indefinidas, una capa de softmax y, finalmente, una capa de resultado con la misma cantidad de nodos que la capa de softmax

¿Qué debo usar en cada momento?

  • Clasificación de una etiqueta en clases múltiples:
    • Un ejemplo puede ser un miembro de una sola clase.
    • Una estructura útil es implementar una restricción para que las clases sean mutuamente exclusivas.
    • Es útil para codificar la clasificación en la pérdida.
    • Usa una pérdida de softmax para todas las clases posibles.
  • Clasificación de múltiples etiquetas en clases múltiples:
    • Un ejemplo podría ser un miembro de más de una clase.
    • No hay restricciones adicionales para aprovechar la pertenencia a una clase.
    • Una pérdida de regresión logística para cada clase posible.

Opciones de softmax

  • Softmax completo
    • Fuerza bruta; realiza cálculos para todas las clases.

Opciones de softmax

  • Softmax completo
    • Fuerza bruta; realiza cálculos para todas las clases.
  • Muestreo de candidatos
    • Realiza cálculos para todas las etiquetas posibles, pero solo para una muestra aleatoria de negativos.

Enviar comentarios sobre…

Curso intensivo de aprendizaje automático