
Con le API per l'etichettatura delle immagini di ML Kit puoi rilevare ed estrarre informazioni sulle entità in un'immagine in un ampio gruppo di categorie. Il modello di etichettatura delle immagini predefinito può identificare oggetti generici, luoghi, attività, specie animali, prodotti e altro ancora.
Puoi anche utilizzare un modello di classificazione delle immagini personalizzato per adattare il rilevamento a un caso d'uso specifico. Per saperne di più, consulta la sezione Utilizzo di un modello LiteRT personalizzato.
Funzionalità chiave
- Un potente classificatore di base per uso generico Riconosce più di 400 categorie che descrivono gli oggetti più comuni nelle foto.
- Personalizza in base al tuo caso d'uso con modelli personalizzati Utilizza altri modelli preaddestrati da TensorFlow Hub o il tuo modello personalizzato addestrato con TensorFlow, AutoML o LiteRT.
- API di alto livello facili da usare Non è necessario gestire l'input/output del modello di basso livello, la pre-elaborazione e la post-elaborazione delle immagini o la creazione di una pipeline di elaborazione. ML Kit estrae le etichette dal modello LiteRT e le fornisce come descrizione testuale.
Tieni presente che questa API è pensata per i modelli di classificazione delle immagini che descrivono l'intera immagine. Per classificare uno o più oggetti in un'immagine, ad esempio scarpe o mobili, l'API Rilevamento e monitoraggio degli oggetti potrebbe essere più adatta.
Modelli di classificazione delle immagini supportati
Le API Image Labeling supportano diversi modelli di classificazione delle immagini:
| Modelli di classificazione delle immagini supportati | |
|---|---|
| Modello di base | Per impostazione predefinita, l'API utilizza un potente modello di etichettatura delle immagini per uso generico che riconosce più di 400 entità che coprono i concetti più comuni all'interno delle foto. |
| Modelli LiteRT personalizzati | Per scegliere come target concetti specifici dell'applicazione, l'API accetta modelli di classificazione delle immagini personalizzati da un'ampia gamma di origini. Questi possono essere modelli preaddestrati scaricati da TensorFlow Hub o modelli personalizzati addestrati con AutoML, LiteRT o TensorFlow stesso. I modelli possono essere raggruppati con l'app o ospitati con Cloud Storage e scaricati in fase di runtime. |
Utilizzo del modello di base
Il modello di base di ML Kit restituisce un elenco di entità che identificano persone, cose, luoghi, attività e così via. Ogni entità è associata a un punteggio che indica la confidenza del modello di ML nella sua pertinenza. Con queste informazioni, puoi eseguire attività come la generazione automatica di metadati e la moderazione dei contenuti. Il modello predefinito fornito con ML Kit riconosce più di 400 entità diverse.
Etichette di esempio
Il modello di base nell'API per l'etichettatura delle immagini supporta oltre 400 etichette, come i seguenti esempi:
| Categoria | Etichette di esempio |
|---|---|
| Persone | CrowdSelfieSmile |
| Attività | DancingEatingSurfing |
| Cose | CarPianoReceipt |
| Animali | BirdCatDog |
| Piante | FlowerFruitVegetable |
| Luoghi | BeachLakeMountain |
Risultati di esempio
Ecco un esempio delle entità riconosciute nella foto allegata.
| Etichetta 0 | |
|---|---|
| Testo | Stadio |
| Confidenza | 0,9205354 |
| Etichetta 1 | |
| Testo | Sport |
| Confidenza | 0,7531109 |
| Etichetta 2 | |
| Testo | Evento |
| Confidenza | 0.66905296 |
| Etichetta 3 | |
| Testo | Tempo libero |
| Confidenza | 0,59904146 |
| Etichetta 4 | |
| Testo | Calcio |
| Confidenza | 0,56384534 |
| Etichetta 5 | |
| Testo | Netto |
| Confidenza | 0,54679185 |
| Etichetta 6 | |
| Testo | Pianta |
| Confidenza | 0,524364 |
Utilizzo di un modello LiteRT personalizzato
Il modello di base per l'etichettatura delle immagini di ML Kit è progettato per un uso generico. È addestrato a riconoscere 400 categorie che descrivono gli oggetti più comuni nelle foto. La tua app potrebbe aver bisogno di un modello di classificazione delle immagini specializzato che riconosca un numero più ristretto di categorie in modo più dettagliato, ad esempio un modello che distingua tra specie di fiori o tipi di cibo.
Questa API ti consente di adattarti a un caso d'uso specifico supportando modelli di classificazione delle immagini personalizzati da un'ampia gamma di origini. Per saperne di più, consulta Modelli personalizzati con ML Kit. I modelli personalizzati possono essere raggruppati con la tua app o scaricati dinamicamente da Cloud Storage.
Pre-elaborazione delle immagini di input
Se necessario, l'etichettatura delle immagini utilizza il ridimensionamento e l'allungamento bilineare delle immagini per regolare le dimensioni delle immagini e le proporzioni dell'immagine di input in modo che soddisfino i requisiti del modello sottostante.