El 30 de julio de 2021 eliminaremos la Práctica de AA: Clasificación de imágenes de este sitio web. La versión en inglés seguirá disponible.

Práctica de AA: Clasificación de imágenes

Aplicación de modelos previamente entrenados

Entrenar una red neuronal convolucional para clasificar imágenes por lo general requiere una enorme cantidad de datos de entrenamiento y puede llevar mucho tiempo en completarse, ya sea días o semanas. Pero ¿qué pasaría si pudieras utilizar modelos de imágenes existentes entrenados con enormes conjuntos de datos, como Inception, y adaptarlos a tus propias tareas de clasificación?

Una técnica convencional para emplear modelos entrenados previamente es la extracción de atributos: El modelo entrenado previamente produce representaciones intermedias y, luego, se introducen estas representaciones en un nuevo modelo como entrada. Por ejemplo, si entrenaste un modelo de clasificación de imágenes para diferenciar diversos tipos de vegetales, podrías introducir imágenes de entrenamiento de zanahorias y apios, entre otras, en un modelo entrenado previamente y, luego, extraer los atributos de su capa convolucional final, que captura toda la información que aprendió el modelo sobre los atributos de alto nivel de las imágenes: el color, la textura, la forma, etc. Luego, al momento de crear tu nuevo modelo de clasificación, en lugar de utilizar píxeles sin procesar, puedes emplear estos atributos extraídos como entrada y agregar tus capas de clasificación totalmente conectadas por encima. Para aumentar el rendimiento cuando se utiliza la extracción de atributos con un modelo entrenado previamente, por lo general los ingenieros ajustan los parámetros de ponderación que se aplican a los atributos extraídos.

Para obtener un estudio más detallado sobre la extracción y el ajuste de atributos cuando se usan modelos entrenados previamente, consulta el siguiente ejercicio.