Enviar solicitações personalizadas para o Gemini Nano com a API GenAI Prompt

Com a API GenAI Prompt do Kit de ML, é possível enviar solicitações em linguagem natural no dispositivo para o Gemini Nano. A API GenAI Prompt aceita uma entrada de texto ou uma entrada combinada de imagem e texto e gera uma saída de texto.

Você pode usar a API GenAI Prompt para vários casos de uso, incluindo os seguintes:

Caso de uso

Exemplo

Compreensão de imagens

Analisar fotos para classificação, como "animais de estimação", "comida" ou "viagem".

Traduções curtas

Traduzir mensagens curtas entre um motorista de entrega e um cliente.

Resumo guiado

Resumir avaliações de um restaurante com base no interesse específico de um usuário.

Extração de entidade

Extrair detalhes importantes sobre um evento futuro de uma conversa por e-mail.

Inspiração para a criação de conteúdo

Sugerir comandos para uma entrada de diário.

Digitalização inteligente de documentos

Extrair e categorizar itens de uma imagem de recibo.

Classificação de texto

Classificar as avaliações dos clientes em uma categoria positiva, neutra ou negativa.

API de solicitação x APIs específicas de recursos

As APIs GenAI do ML Kit atuais oferecem suporte aos casos de uso Resumo, Revisão, Reescrita e Descrição de imagem, que também são compatíveis com a API Prompt. A tabela a seguir descreve os benefícios de cada um:

Consideração

API Prompt

APIs específicas de recursos

Esforço de integração

Alto.

Exige mais esforço para ser implementado devido à engenharia de comando e ao controle de qualidade.

Que nada.

Exige menos esforço, já que essas APIs já estão ajustadas para casos de uso específicos. Não é necessário trabalhar diretamente com o LLM.

Flexibilidade

Mais flexibilidade, já que você pode personalizar o comando.

Menos flexibilidade. Cada API tem um ajuste refinado fixo e um comando integrado com as seguintes características:

  • Os resumos podem ter apenas de um a três marcadores.
  • A descrição da imagem é genérica e curta.
  • A reescrita só é compatível com estilos predefinidos.

Como regra geral, use a API Prompt quando precisar de mais personalização e flexibilidade, e use as APIs específicas de recursos para tarefas padrão que não exigem lógica complexa.

Código de amostra