GenAI Prompt API を使用して Gemini Nano にカスタムリクエストを送信する

ML Kit の GenAI Prompt API を使用すると、オンデバイスで Gemini Nano に自然言語リクエストを送信できます。GenAI Prompt API は、テキスト入力または画像とテキストの組み合わせ入力を受け入れ、テキスト出力を生成します。

GenAI Prompt API は、次のようなさまざまなユースケースで使用できます。

ユースケース	例
画像理解	写真の分類（「ペット」、「食べ物」、「旅行」など）のための分析。
短い翻訳	配達員とお客様間の短いメッセージを翻訳します。
ガイド付きの要約	ユーザーの特定の興味に基づいてレストランのレビューを要約します。
エンティティの抽出	メールスレッドから今後のイベントに関する重要な詳細情報を抽出する。
コンテンツ生成のヒント	日記のエントリのプロンプトを提案する。
インテリジェントなドキュメントスキャン	領収書の画像から項目を抽出して分類します。注: 最適な結果を得るには、まず ML Kit Text Recognition API を使用して画像からテキストを抽出することを検討してください。次に、Prompt API を使用して、元の画像のコンテキストでテキストをさらに処理します。
テキスト分類	購入者レビューを肯定的、中立的、否定的なカテゴリに分類する。

プロンプト API と機能固有の API

既存の ML Kit GenAI API は、要約、校正、書き換え、画像の説明のユースケースをサポートしており、Prompt API もこれらのユースケースをサポートしています。次の表に、各方法のメリットを示します。

検討事項

Prompt API

機能固有の API

統合の作業量

高。

プロンプトエンジニアリングと品質保証のため、実装に手間がかかります。

ドライブ

これらの API は特定のユースケースに合わせてすでにファインチューニングされているため、労力が少なくて済みます。LLM を直接操作する必要はありません。

柔軟性

プロンプトをカスタムエンジニアリングできるため、柔軟性が高まります。

柔軟性が低い。各 API には、次の特徴を持つ固定のファインチューニングと組み込みのプロンプトがあります。

原則として、カスタマイズと柔軟性がより必要な場合は Prompt API を使用し、複雑なロジックを必要としない標準的なタスクには機能固有の API を使用します。