Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Étiquette d'image

Avec les API d'étiquetage d'image de ML Kit, vous pouvez détecter et extraire des informations sur les entités d'une image dans un large groupe de catégories. Le modèle d'étiquetage d'image par défaut peut identifier des objets généraux, des lieux, des activités, des espèces animales, des produits, etc.

Vous pouvez également utiliser un modèle de classification d'images personnalisé pour adapter la détection à un cas d'utilisation spécifique. Pour en savoir plus, consultez la page Utiliser un modèle TensorFlow Lite personnalisé.

Capacités clés

  • Un classificateur de base puissant à usage général Reconnaît plus de 400 catégories décrivant les objets les plus couramment détectés sur les photos.
  • Adaptez-vous à votre cas d'utilisation grâce aux modèles personnalisés Utilisez d'autres modèles pré-entraînés de TensorFlow Hub, ou votre propre modèle entraîné avec TensorFlow, AutoML Vision Edge ou TensorFlow Lite Model Maker.
  • API de haut niveau faciles à utiliser Vous n'avez pas besoin de gérer les entrées/sorties de modèle de bas niveau, le prétraitement et le post-traitement des images, ni de créer un pipeline de traitement. ML Kit extrait les étiquettes du modèle TensorFlow Lite et les fournit sous forme de description textuelle.

Notez que cette API est destinée aux modèles de classification d'images qui décrivent l'image entière. Pour classer un ou plusieurs objets dans une image, tels que des chaussures ou des meubles, l'API Object Detection &Tracking peut être plus adaptée.

Modèles de classification d'images compatibles

Les API Image Labeling sont compatibles avec différents modèles de classification d'images:

Modèles de classification d'images compatibles
Modèle de base Par défaut, l'API utilise un modèle puissant d'étiquetage d'images à usage général qui reconnaît plus de 400 entités couvrant les concepts les plus couramment détectés dans les photos.
Modèles TensorFlow Lite personnalisés Pour cibler des concepts spécifiques à une application, l'API accepte des modèles de classification d'images personnalisés provenant d'un large éventail de sources. Il peut s'agir de modèles pré-entraînés téléchargés à partir de TensorFlow Hub, ou de vos propres modèles entraînés avec AutoML Vision Edge, TensorFlow Lite Model Maker ou TensorFlow. Les modèles peuvent être regroupés avec votre application ou hébergés avec Firebase Machine Learning, et téléchargés au moment de l'exécution.

Utiliser le modèle de base

Le modèle de base de ML Kit renvoie une liste d'entités qui identifient des personnes, des choses, des lieux, des activités, etc. Chaque entité est associée à un score qui indique le niveau de confiance du modèle de ML en termes de pertinence. Grâce à ces informations, vous pouvez effectuer des tâches telles que la génération automatique de métadonnées et la modération de contenu. Le modèle par défaut fourni avec ML Kit reconnaît plus de 400 entités différentes.

iOS Android

Exemples de libellés

Le modèle de base de l'API Image Label accepte plus de 400 étiquettes, telles que les exemples suivants:

CatégorieExemples de libellés
Personnes Crowd
Selfie
Smile
Activités Dancing
Eating
Surfing
Objets Car
Piano
Receipt
Animaux Bird
Cat
Dog
Plantes Flower
Fruit
Vegetable
Places Beach
Lake
Mountain

Exemples de résultats

Voici un exemple d'entités reconnues sur la photo associée.

Photo: Clément Bucco-Lechat/Wikimedia Commons/CC BY-SA 3.0
Étiquette 0
Texte Stade
Confiance 0,9205354
Label 1
Texte Sport
Confiance 0,7531109
Label 2
Texte Événement
Confiance 0,66905296
Label 3
Texte Loisirs
Confiance 0,59904146
Label 4
Texte Football
Confiance 0,56384534
Étiquette 5
Texte Nette
Confiance 0,54679185
Étiquette 6
Texte Plante
Confiance 0,524364

Utiliser un modèle TensorFlow Lite personnalisé

Le modèle d'étiquetage d'image de base du ML Kit est conçu pour une utilisation générale. Il est entraîné à reconnaître 400 catégories décrivant les objets les plus couramment trouvés dans les photos. Votre application peut avoir besoin d'un modèle de classification d'images spécialisé qui reconnaisse un plus petit nombre de catégories. Il peut s'agir, par exemple, d'un modèle permettant de distinguer des espèces de fleurs ou des types d'aliments.

Cette API vous permet de vous adapter à un cas d'utilisation particulier en acceptant des modèles de classification d'images personnalisés à partir d'un large éventail de sources. Pour en savoir plus, consultez la page Modèles personnalisés avec ML Kit. Les modèles personnalisés peuvent être regroupés avec votre application ou téléchargés de manière dynamique à partir du cloud à l'aide du service de déploiement de modèles Firebase Machine Learning.

iOS Android

Prétraitement des images d'entrée

Si nécessaire, l'étiquetage d'images utilise la mise à l'échelle et l'étirement bilinéaires pour ajuster la taille et le format de l'image d'entrée afin de les adapter aux exigences du modèle sous-jacent.