GenAI Prompt API を使用して Gemini Nano にカスタム リクエストを送信する

ML Kit の GenAI Prompt API を使用すると、オンデバイスで Gemini Nano に自然言語リクエストを送信できます。GenAI Prompt API は、テキスト入力または画像とテキストの組み合わせ入力を受け入れ、テキスト出力を生成します。

GenAI Prompt API は、次のようなさまざまなユースケースで使用できます。

ユースケース

画像理解

写真の分類(「ペット」、「食べ物」、「旅行」など)のための分析。

短い翻訳

配達員とお客様間の短いメッセージを翻訳します。

ガイド付きの要約

ユーザーの特定の興味に基づいてレストランのレビューを要約します。

エンティティの抽出

メールスレッドから今後のイベントに関する重要な詳細情報を抽出する。

コンテンツ生成のヒント

日記のエントリのプロンプトを提案する。

インテリジェントなドキュメント スキャン

領収書の画像から項目を抽出して分類する。

テキスト分類

購入者レビューを肯定的、中立的、否定的のカテゴリに分類する。

プロンプト API と機能固有の API

既存の ML Kit GenAI API は、要約校正書き換え画像の説明のユースケースをサポートしており、Prompt API もこれらのユースケースをサポートしています。次の表に、各方法のメリットを示します。

検討事項

Prompt API

機能固有の API

統合の作業量

高。

プロンプト エンジニアリングと品質保証のため、実装に手間がかかります。

ドライブ

これらの API は特定のユースケースに合わせてすでにファインチューニングされているため、労力が少なくて済みます。LLM を直接操作する必要はありません。

柔軟性

プロンプトをカスタム エンジニアリングできるため、柔軟性が高まります。

柔軟性が低い。各 API には、次の特徴を持つ固定のファインチューニングと組み込みのプロンプトがあります。

  • 要約は 1 ~ 3 個の箇条書きで記述する必要があります。
  • 画像の説明が一般的で短い。
  • 書き換えでは、事前定義されたスタイルのみがサポートされます。

原則として、カスタマイズと柔軟性がより必要な場合は Prompt API を使用し、複雑なロジックを必要としない標準的なタスクには機能固有の API を使用します。

サンプルコード