Mit der GenAI Prompt API von ML Kit können Sie Anfragen in natürlicher Sprache auf dem Gerät an Gemini Nano senden. Die GenAI Prompt API akzeptiert entweder eine Texteingabe oder eine kombinierte Bild- und Texteingabe und gibt Text aus.
Sie können die GenAI Prompt API für eine Vielzahl von Anwendungsfällen verwenden, darunter:
Anwendungsbeispiel |
Beispiel |
Bilder verstehen |
Fotos werden analysiert, um sie zu klassifizieren, z. B. als „Haustiere“, „Essen“ oder „Reisen“. |
Kurze Übersetzungen |
Übersetzung von Kurznachrichten zwischen einem Zusteller und einem Kunden |
Geführte Zusammenfassung |
Zusammenfassung von Rezensionen eines Restaurants basierend auf den spezifischen Interessen eines Nutzers |
Entitätsextraktion |
Wichtige Details zu einer anstehenden Veranstaltung aus einer E‑Mail-Konversation extrahieren |
Inspiration für die Inhaltserstellung |
Vorschläge für Prompts für einen Tagebucheintrag |
Intelligentes Scannen von Dokumenten |
Artikel aus einem Belegbild extrahieren und kategorisieren |
Textklassifizierung |
Kundenrezensionen in die Kategorien „Positiv“, „Neutral“ oder „Negativ“ einordnen. |
Prompt API im Vergleich zu funktionsspezifischen APIs
Die vorhandenen ML Kit GenAI-APIs unterstützen die Anwendungsfälle Zusammenfassung, Korrekturlesen, Umschreiben und Bildbeschreibung, die auch von der Prompt API unterstützt werden. In der folgenden Tabelle sind die Vorteile der einzelnen Optionen aufgeführt:
Kaufbereitschaft |
Prompt API |
Funktionsspezifische APIs |
Integrationsaufwand |
Hoch Die Implementierung erfordert mehr Aufwand, da Prompt-Engineering und Qualitätssicherung erforderlich sind. |
und wenig Stress Weniger Aufwand, da diese APIs bereits für bestimmte Anwendungsfälle optimiert sind. Sie müssen nicht direkt mit dem LLM arbeiten. |
Flexibilität |
Mehr Flexibilität, da Sie den Prompt individuell anpassen können. |
Weniger Flexibilität: Jede API hat ein festes Fine-Tuning und einen integrierten Prompt mit den folgenden Merkmalen:
|
Im Allgemeinen gilt: Verwenden Sie die Prompt API, wenn Sie mehr Anpassungsmöglichkeiten und Flexibilität benötigen, und die funktionsspezifischen APIs für Standardaufgaben, die keine komplexe Logik erfordern.