ML Kit の GenAI Prompt API を使用すると、オンデバイスで Gemini Nano に自然言語リクエストを送信できます。GenAI Prompt API は、テキスト入力または画像とテキストの組み合わせ入力を受け入れ、テキスト出力を生成します。
GenAI Prompt API は、次のようなさまざまなユースケースで使用できます。
ユースケース |
例 |
画像理解 |
写真の分類(「ペット」、「食べ物」、「旅行」など)のための分析。 |
短い翻訳 |
配達員とお客様間の短いメッセージを翻訳します。 |
ガイド付きの要約 |
ユーザーの特定の興味に基づいてレストランのレビューを要約します。 |
エンティティの抽出 |
メールスレッドから今後のイベントに関する重要な詳細情報を抽出する。 |
コンテンツ生成のヒント |
日記のエントリのプロンプトを提案する。 |
インテリジェントなドキュメント スキャン |
領収書の画像から項目を抽出して分類する。 |
テキスト分類 |
購入者レビューを肯定的、中立的、否定的のカテゴリに分類する。 |
プロンプト API と機能固有の API
既存の ML Kit GenAI API は、要約、校正、書き換え、画像の説明のユースケースをサポートしており、Prompt API もこれらのユースケースをサポートしています。次の表に、各方法のメリットを示します。
検討事項 |
Prompt API |
機能固有の API |
統合の作業量 |
高。 プロンプト エンジニアリングと品質保証のため、実装に手間がかかります。 |
ドライブ これらの API は特定のユースケースに合わせてすでにファインチューニングされているため、労力が少なくて済みます。LLM を直接操作する必要はありません。 |
柔軟性 |
プロンプトをカスタム エンジニアリングできるため、柔軟性が高まります。 |
柔軟性が低い。各 API には、次の特徴を持つ固定のファインチューニングと組み込みのプロンプトがあります。
|
原則として、カスタマイズと柔軟性がより必要な場合は Prompt API を使用し、複雑なロジックを必要としない標準的なタスクには機能固有の API を使用します。