Descripción general de las APIs de IA generativa de ML Kit

Las APIs de IA generativa de ML Kit aprovechan el poder de Gemini Nano para ayudar a tus apps a realizar tareas. Estas APIs proporcionan calidad lista para usar para casos de uso populares a través de una interfaz de alto nivel. Las APIs de IA generativa de ML Kit se compilan en AICore, un servicio del sistema Android que permite la ejecución en el dispositivo de los modelos de base de IA generativa para facilitar funciones como la funcionalidad mejorada de la app y la privacidad del usuario mejorada mediante el procesamiento de datos de forma local.

Las APIs de IA generativa de ML Kit admiten las siguientes funciones:

  • Resumen: Resume artículos o conversaciones de chat como una lista con viñetas.
  • Revisión de texto: Define mejor la gramática y corrige los errores de ortografía para perfeccionar el contenido breve.
  • Reescritura: Reescribe mensajes cortos en diferentes tonos o estilos.
  • Descripción de la imagen: Genera una descripción breve de una imagen determinada.

Beneficios de las APIs de IA generativa

Al igual que otras funciones existentes de ML Kit, las APIs de GenAI se ejecutan por completo en el dispositivo y, por lo tanto, proporcionan los siguientes beneficios:

  • Los datos de entrada, inferencia y salida se procesan de forma local
  • La funcionalidad sigue siendo la misma sin una conexión a Internet confiable
  • No se incurre en ningún costo de servidor adicional por cada llamada a la API.

Además, como las APIs de GenAI se compilan en AICore y se basan en Gemini Nano, cada app puede usar el modelo compartido de Gemini Nano que se encuentra en el dispositivo. Esto evita tener que esperar a que se descargue un modelo si ya existe en un dispositivo y, a su vez, conserva el espacio de almacenamiento. Obtén más información sobre cómo AICore aísla las solicitudes para proteger la privacidad.

Transmisión y sin transmisión

Las APIs de GenAI de ML Kit ofrecen opciones de transmisión y no transmisión para recibir resultados. La API de transmisión entrega respuestas de forma incremental a medida que se generan, lo que proporciona un flujo continuo de datos. En cambio, la API que no es de transmisión espera hasta que se complete toda la respuesta antes de mostrarla como un bloque único.

Elige la API de transmisión para respuestas largas, ya que permite obtener comentarios iniciales más rápidos. La API que no es de transmisión es más adecuada para respuestas cortas o cuando se procesan resultados en lotes.

Dispositivos compatibles

Las APIs de IA generativa de ML Kit están disponibles en los siguientes dispositivos, y se planea expandir la compatibilidad a dispositivos adicionales:

  • Google: Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL y Pixel 9 Pro Fold
  • Honor: Magic 7 Pro y Magic 7
  • iQOO: iQOO 13
  • Motorola: Razr 60 Ultra
  • OnePlus: OnePlus 13 y OnePlus 13s
  • OPPO: Find N5, Find X8 y Find X8 Pro
  • POCO: POCO F7 Ultra
  • realme: realme GT 7 Pro
  • Samsung: Galaxy S25, Galaxy S25+ y Galaxy S25 Ultra
  • vivo: vivo X200 y vivo X200 Pro
  • Xiaomi: Xiaomi 15 Ultra y Xiaomi 15

La disponibilidad de compatibilidad con idiomas específicos puede variar según la configuración del dispositivo en particular y los modelos que se descargaron en él.

Cuota por aplicación

AICore aplica una cuota de inferencia por app. Esto significa que realizar demasiadas solicitudes a la API de GenAI en un período breve generará una respuesta ErrorCode.BUSY. Cuando recibas un error de este tipo, considera usar la retirada exponencial para volver a intentar la solicitud.

Uso en segundo plano

La inferencia de la API de GenAI solo se permite cuando la app es la aplicación en primer plano superior. El uso de la API cuando la app no está en primer plano, incluido el uso de un servicio en primer plano, generará una respuesta ErrorCode.BUSY debido a la falta actual de cuota de uso en segundo plano.

Código de muestra

Para obtener este código, consulta los siguientes ejemplos: