Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Etiquetado de imágenes

Con las API de etiquetado de imágenes del Kit de AA, puedes detectar y extraer información sobre las entidades de una imagen en un amplio grupo de categorías. El modelo de etiquetado de imágenes predeterminado puede identificar objetos, lugares, actividades, especies de animales, productos y mucho más.

También puedes usar un modelo de clasificación de imágenes personalizado para adaptar la detección a un caso práctico específico. Consulta Usa un modelo personalizado de TensorFlow Lite para obtener más información.

Funciones clave

  • Un potente clasificador básico de uso general Reconoce más de 400 categorías que describen los objetos que se encuentran con más frecuencia en las fotos.
  • Adapta tu caso de uso con modelos personalizados Usa otros modelos previamente entrenados de TensorFlow Hub o tu propio modelo personalizado entrenado con TensorFlow, AutoML Vision Edge o el creador de modelos TensorFlow Lite.
  • API de alto nivel fáciles de usar No necesitas lidiar con entradas y salidas del modelo de bajo nivel, procesamiento previo ni posterior al procesamiento de imágenes, ni compilar una canalización de procesamiento. El Kit de AA extrae las etiquetas del modelo de TensorFlow Lite y las proporciona como una descripción de texto.

Ten en cuenta que esta API está diseñada para modelos de clasificación de imágenes que describen la imagen completa. Para clasificar uno o más objetos en una imagen, como zapatos o muebles, la API de Detección de objetos y seguimiento puede ser una mejor opción.

Modelos de clasificación de imágenes compatibles

Las API de etiquetado de imágenes admiten diferentes modelos de clasificación de imágenes:

Modelos de clasificación de imágenes compatibles
Modelo base De forma predeterminada, la API usa un potente modelo de etiquetado de imágenes de uso general que reconoce más de 400 entidades que cubren los conceptos que se encuentran con mayor frecuencia en las fotos.
Modelos personalizados de TensorFlow Lite Para orientar conceptos específicos de la aplicación, la API acepta modelos personalizados de clasificación de imágenes de una amplia variedad de fuentes. Pueden ser modelos entrenados previamente descargados de TensorFlow Hub o tus propios modelos entrenados con AutoML Vision Edge, TensorFlow Lite Model Maker o TensorFlow. Los modelos se pueden agrupar con tu app o alojar con Firebase Machine Learning y descargarlos durante el tiempo de ejecución.

Usa el modelo base

El modelo base del Kit de AA muestra una lista de entidades que identifican personas, cosas, lugares, actividades, etcétera. Cada entidad incluye una puntuación que indica la confianza que tiene el modelo de AA en su relevancia. Con esta información, puedes realizar tareas como la generación automática de metadatos y la moderación de contenido. El modelo predeterminado que se proporciona con el Kit de AA reconoce más de 400 entidades diferentes.

iOS Android

Etiquetas de ejemplo

El modelo base en la API de etiquetado de imágenes admite más de 400 etiquetas, como en los siguientes ejemplos:

CategoríaEtiquetas de ejemplo
Personas Crowd
Selfie
Smile
Actividades Dancing
Eating
Surfing
Things Car
Piano
Receipt
Animales Bird
Cat
Dog
Plantas Flower
Fruit
Vegetable
Places Beach
Lake
Mountain

Resultados de ejemplo

A continuación, se muestra un ejemplo de las entidades que se reconocieron en la foto adjunta.

Foto: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
Etiqueta 0
Texto Estadio
Confianza 0,9205354
Etiqueta 1
Texto Deportes
Confianza 0,7531109
Etiqueta 2
Texto Evento
Confianza 0,66905296
Etiqueta 3
Texto Ocio
Confianza 0,59904146
Etiqueta 4
Texto Fútbol
Confianza 0,56384534
Etiqueta 5
Texto Neta
Confianza 0,54679185
Etiqueta 6
Texto Planta
Confianza 0,524364

Usa un modelo personalizado de TensorFlow Lite

El modelo de etiquetado de imágenes base del Kit de AA se diseñó para uso general. Se entrenó para reconocer 400 categorías que describen los objetos que se encuentran con más frecuencia en las fotos. Es posible que tu app necesite un modelo de clasificación de imágenes especializado que reconozca una cantidad menor de categorías con más detalle, como un modelo que distinga entre especies de flores o tipos de comida.

Esta API te permite adaptarla a un caso práctico particular mediante la compatibilidad con modelos de clasificación de imágenes personalizados de una amplia gama de fuentes. Consulta Modelos personalizados con el Kit de AA para obtener más información. Los modelos personalizados se pueden agrupar con tu app o descargar de forma dinámica desde la nube mediante el servicio de implementación de modelos de aprendizaje automático de Firebase.

iOS Android

Procesamiento previo de imágenes de entrada

Si es necesario, el etiquetado de imágenes usa escalamiento y estiramiento de imágenes bilineales para ajustar el tamaño de la imagen de entrada y la relación de aspecto a fin de que se ajusten a los requisitos del modelo subyacente.