Pratique du ML: classification d'images

Exploiter des modèles pré-entraînés

L'entraînement d'un réseau de neurones convolutif pour effectuer des tâches de classification d'images nécessite généralement une quantité extrêmement importante de données d'entraînement et peut prendre beaucoup de temps. Sa réalisation peut prendre des jours, voire des semaines. Et si vous pouviez exploiter des modèles d'images existants entraînés sur des ensembles de données volumineux, par exemple via TensorFlow-Slim, et les adapter pour vos propres tâches de classification ?

L'extraction de caractéristiques est une technique courante pour exploiter les modèles pré-entraînés. Elle consiste à récupérer les représentations intermédiaires produites par le modèle pré-entraîné, puis à alimenter ces représentations dans un nouveau modèle en tant qu'entrée. Par exemple, si vous entraînez un modèle de classification d'images pour distinguer différents types de légumes, vous pouvez insérer des images de carottes, de céleri, etc. dans un modèle pré-entraîné, puis en extraire les caractéristiques de sa couche de convolution finale, qui capturent toutes les informations que le modèle a apprises sur les images ; à l'entrée Pour améliorer les performances de l'extraction de caractéristiques avec un modèle pré-entraîné, les ingénieurs optimisent souvent les paramètres de pondération appliqués aux caractéristiques extraites.

Pour une analyse plus approfondie de l'extraction de caractéristiques et de l'ajustement des modèles pré-entraînés, consultez l'exercice suivant.