Отправляйте пользовательские запросы в Gemini Nano с помощью API GenAI Prompt

С помощью API GenAI Prompt из ML Kit вы можете отправлять запросы на естественном языке с устройства Gemini Nano . API GenAI Prompt принимает как текстовый ввод, так и комбинированный ввод изображения и текста и выводит текстовый вывод.

API GenAI Prompt можно использовать в различных случаях, включая следующие:

Вариант использования

Пример

Понимание изображения

Анализ фотографий на предмет классификации, например, «питомцы», «еда» или «путешествия».

Короткие переводы

Перевод коротких сообщений между водителем-экспедитором и клиентом.

Управляемое обобщение

Обобщение отзывов о ресторане на основе конкретных интересов пользователя.

Извлечение сущностей

Извлечение важных сведений о предстоящем событии из цепочки электронных писем.

Вдохновение для создания контента

Предлагаю подсказки для записи в журнале.

Интеллектуальное сканирование документов

Извлечение и категоризация товаров из изображения чека.

Классификация текста

Классификация отзывов клиентов на положительную, нейтральную или отрицательную категорию.

Prompt API в сравнении с API, ориентированными на конкретные функции

Существующие API GenAI из ML Kit поддерживают сценарии реферирования , корректуры , переписывания и описания изображений , которые также поддерживает Prompt API. В следующей таблице описаны преимущества каждого из них:

Рассмотрение

API-интерфейс Prompt

API-интерфейсы, специфичные для функций

Интеграционные усилия

Высокий.

Требует больше усилий для внедрения из-за необходимости быстрого проектирования и контроля качества.

Низкий.

Требует меньше усилий, поскольку эти API уже настроены под конкретные сценарии использования. Не требуется работать напрямую с LLM.

Гибкость

Больше гибкости, поскольку вы можете настроить подсказку индивидуально.

Меньше гибкости. Каждый API имеет фиксированную тонкую настройку и встроенную подсказку со следующими характеристиками:

  • Обобщения могут содержать только 1–3 пункта.
  • Описание изображения является общим и кратким.
  • Переписывание поддерживает только предопределенные стили.

Как правило, Prompt API следует использовать, когда вам требуется больше возможностей настройки и гибкости, а API-интерфейсы, предназначенные для конкретных функций, — для стандартных задач, не требующих сложной логики.

Пример кода