Prática de ML: classificação de imagens

Como aproveitar modelos pré-treinados

Treinar uma rede neural convolucional para realizar tarefas de classificação de imagens geralmente requer uma quantidade extremamente grande de dados de treinamento e pode levar muito tempo, dias ou até semanas. Mas e se você pudesse aproveitar modelos de imagens existentes treinados em conjuntos de dados enormes, como via TensorFlow Slim, e adaptá-los para uso em suas próprias tarefas de classificação?

Uma técnica comum para aproveitar os modelos pré-treinados é a extração de atributos, ou seja, recuperar representações intermediárias produzidas pelo modelo pré-treinado e, em seguida, alimentar essas representações em um novo modelo como entrada. Por exemplo, se você estiver treinando um modelo de classificação de imagens para distinguir diferentes tipos de vegetais, poderá alimentar imagens de treinamento de cenouras, celebridades e assim por diante em um modelo pré-treinado e, em seguida, extrair os atributos da camada de convolução final, que captura todas as informações que o modelo aprendeu sobre imagens, cor, textura, textura, textura, textura, construção, textura, textura, textura, textura, textura, composição Para melhorar o desempenho ao usar a extração de atributos com um modelo pré-treinado, os engenheiros geralmente ajustam os parâmetros de peso aplicados aos atributos extraídos.

Para uma exploração mais detalhada da extração de atributos e do ajuste detalhado ao usar modelos pré-treinados, consulte o Exercício a seguir.