Con l'API GenAI Prompt di ML Kit, puoi inviare richieste in linguaggio naturale sul dispositivo a Gemini Nano. L'API GenAI Prompt accetta un input di testo o un input combinato di immagine e testo ed emette un output di testo.
Puoi utilizzare l'API GenAI Prompt per una serie di casi d'uso, tra cui i seguenti:
Caso d'uso |
Esempio |
Comprensione delle immagini |
Analisi delle foto per la classificazione, ad esempio "animali domestici", "cibo" o "viaggi". |
Traduzioni brevi |
Traduzione di messaggi brevi tra un autista addetto alle consegne e un cliente. |
Riepilogo guidato |
Riassumere le recensioni di un ristorante in base a un interesse specifico dell'utente. |
Estrazione di entità |
Estrazione di dettagli importanti su un evento imminente da un thread email. |
Ispirazione per la generazione di contenuti |
Suggerire prompt per una voce del journal. |
Scansione intelligente dei documenti |
Estrazione e classificazione degli articoli da un'immagine della ricevuta. |
Classificazione del testo |
Classificare le recensioni dei clienti in una categoria positiva, neutra o negativa. |
API Prompt e API specifiche per funzionalità
Le API ML Kit GenAI esistenti supportano i casi d'uso Riepilogo, Correzione bozza, Riscrittura e Descrizione immagine, supportati anche dall'API Prompt. La tabella seguente illustra i vantaggi di ciascuna opzione:
Considerazione |
API Prompt |
API specifiche per funzionalità |
Impegno richiesto per l'integrazione |
Alto. Richiede più impegno per l'implementazione, a causa dell'ingegneria dei prompt e del controllo qualità. |
stress. Richiedono meno impegno, in quanto queste API sono già ottimizzate per casi d'uso specifici. Non è necessario interagire direttamente con l'LLM. |
Flessibilità |
Maggiore flessibilità, in quanto puoi personalizzare il prompt. |
Meno flessibilità. Ogni API ha un affinamento predefinito e un prompt integrato con le seguenti caratteristiche:
|
Come regola generale, utilizza l'API Prompt quando hai bisogno di maggiore personalizzazione e flessibilità e utilizza le API specifiche delle funzionalità per le attività standard che non richiedono una logica complessa.