Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Descripción general de las APIs de IA generativa de ML Kit

Las APIs de IA generativa de ML Kit aprovechan el poder de Gemini Nano para ayudar a tus apps a realizar tareas. Estas APIs proporcionan calidad lista para usar en casos de uso populares a través de una interfaz de alto nivel. Las APIs de IA generativa de ML Kit se compilan sobre AICore, un servicio del sistema Android que permite la ejecución en el dispositivo de modelos básicos de IA generativa para facilitar funciones como la funcionalidad mejorada de la app y la privacidad del usuario mejorada a través del procesamiento de datos local.

Las Condiciones del Servicio Adicionales de las APIs de IA generativa de ML Kit se aplican al uso de las APIs de IA generativa. Los desarrolladores son los únicos responsables de la seguridad de su cliente de API y de la experiencia del usuario de su app.

Características clave

Las APIs de IA generativa de ML Kit admiten las siguientes funciones:

Resumen: Resume artículos o conversaciones de chat en una lista con viñetas.
Revisión de texto: Mejora el contenido breve corrigiendo la gramática y los errores de ortografía.
Reescritura: Reescribe mensajes cortos en diferentes tonos o estilos.
Descripción de la imagen: Genera una descripción breve de una imagen determinada.
Reconocimiento de voz: Transcribe contenido de audio a texto.
Instrucción: Genera contenido de texto basado en una instrucción personalizada multimodal o solo de texto.

Beneficios de las APIs de IA generativa

Al igual que otras funciones existentes de ML Kit, las APIs de IA generativa se ejecutan completamente en el dispositivo y, por lo tanto, proporcionan los siguientes beneficios:

Los datos de entrada, inferencia y salida se procesan de forma local.
La funcionalidad sigue siendo la misma sin una conexión a Internet confiable
No se incurre en costos adicionales del servidor por cada llamada a la API.

Además, dado que las APIs de IA generativa se compilan sobre AICore y se ejecutan con Gemini Nano, todas las apps pueden usar el modelo compartido de Gemini Nano que se encuentra en el dispositivo. Esto evita la necesidad de esperar a que se descargue un modelo si ya existe en un dispositivo y, a su vez, conserva espacio de almacenamiento. Obtén más información sobre cómo AICore aísla las solicitudes para proteger la privacidad.

Transmisión en comparación con sin transmisión

Las APIs de IA generativa de ML Kit ofrecen opciones de transmisión y de no transmisión para recibir resultados. La API de transmisión entrega respuestas de forma incremental a medida que se generan, lo que proporciona un flujo continuo de datos. En cambio, la API sin transmisión espera hasta que se completa toda la respuesta antes de devolverla como un solo bloque.

Elige la API de transmisión para respuestas extensas, ya que permite obtener comentarios iniciales más rápidos. La API que no es de transmisión es más adecuada para respuestas cortas o cuando se procesan resultados en lotes.

Dispositivos compatibles

Las APIs específicas de las funciones de IA generativa (Resumen, Corrección, Reformulación y Descripción de imágenes) tienen una compatibilidad con dispositivos diferente a la de la API de Prompt, como se describe en las siguientes secciones.

Compatibilidad de la API con dispositivos específicos de la función

Las APIs de Summarization, Proofreading, Rewriting y Image Description están disponibles en los siguientes dispositivos, y se planea expandir la compatibilidad a otros dispositivos:

Google: Pixel 10, Pixel 10 Pro, Pixel 10 Pro XL, Pixel 10 Pro Fold, Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL y Pixel 9 Pro Fold
Honor: Honor 400 Pro, Magic 7, Magic 7 Pro, Magic 8 Pro y Magic V5
iQOO: iQOO 13, iQOO 15
Lenovo: Lenovo Idea Tab Pro Gen 2, Lenovo Legion Tab Gen 5(8.8")
Motorola: Razr 60 Ultra, Razr Ultra 2025, Signature
OnePlus: OnePlus 15, OnePlus 15R, OnePlus 13 y OnePlus 13s
OPPO: Find N5, Find X9, Find X9 Pro, Find X8, Find X8 Pro, Reno 14 Pro 5G, Reno 15 Pro 5G, Reno 15 Pro Mini 5G, Reno 15 Pro Max 5G
POCO: POCO F7 Ultra, POCO F8 Pro, POCO F8 Ultra, POCO X7 Pro y POCO X8 Pro
realme: realme GT 7 Pro y realme GT 7T
Samsung: Galaxy S25, Galaxy S25+, Galaxy S25 Ultra, Galaxy S26, Galaxy S26+, Galaxy S26 Ultra, Galaxy Z Fold7, Galaxy Z TriFold
Sharp: AQUOS R11
vivo: vivo X200T, vivo X200 FE, vivo X200, vivo X200 Pro, vivo X300, X300 Pro, vivo X Fold3 Pro, vivo X Fold5, vivo T4 Ultra
Xiaomi: Xiaomi 14T Pro, Xiaomi 15, Xiaomi 15T, Xiaomi 15T Pro, Xiaomi 15 Ultra, Xiaomi 17, Xiaomi 17 Ultra y Xiaomi Pad Mini

La disponibilidad de asistencia en idiomas específicos puede variar según la configuración del dispositivo y los modelos que se hayan descargado en él.

Compatibilidad de la API de Prompt con dispositivos

La API de Prompt es compatible con los siguientes dispositivos:

nano-v2

Honor: Magic V5, Magic 7 y Magic 7 Pro
iQOO: iQOO 13
Motorola: Razr 60 Ultra, Razr Ultra 2025
OnePlus: OnePlus 13 y OnePlus 13s
OPPO: Find N5
POCO: POCO F7 Ultra, POCO F8 Pro, POCO F8 Ultra, POCO X7 Pro y POCO X8 Pro
realme: realme GT 7 Pro
Samsung: Galaxy Z Fold7, Galaxy Z TriFold
vivo: vivo X200 FE y vivo T4 Ultra
Xiaomi: Xiaomi 14T Pro, Xiaomi 15, Xiaomi 15T, Xiaomi 15T Pro, Xiaomi 15 Ultra, Xiaomi 17, Xiaomi 17 Ultra, Xiaomi Pad Mini

nano-v3

Google: Pixel 10, Pixel 10 Pro, Pixel 10 Pro XL, Pixel 10 Pro Fold, Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL y Pixel 9 Pro Fold
Honor: Honor Magic 8 Pro
iQOO: iQOO 15
Lenovo: Lenovo Idea Tab Pro Gen 2, Lenovo Legion Tab Gen 5(8.8")
Motorola: Firma
OnePlus: OnePlus 15 y OnePlus 15R
OPPO: Find X9, Find X9 Pro, Find X8, Find X8 Pro, Reno 14 Pro 5G, Reno 15 Pro 5G, Reno 15 Pro Mini 5G, Reno 15 Pro Max 5G
realme: realme GT 7T
Samsung: Galaxy S26, Galaxy S26+, Galaxy S26 Ultra
Sharp: AQUOS R11
vivo: vivo X200T, vivo X200, vivo X200 Pro, vivo X300, vivo X300 Pro

Compatibilidad de dispositivos con la API de Speech Recognition

La API de Speech Recognition es compatible con los siguientes dispositivos:

Modo básico	Usa el modelo tradicional de reconocimiento de voz en el dispositivo, disponible en la mayoría de los dispositivos Android con el nivel de API 31 y versiones posteriores.
Modo avanzado	Aprovecha el modelo de IA generativa para obtener una mayor calidad y una cobertura de idiomas más amplia. Es compatible con dispositivos Pixel 10 y se está desarrollando para más dispositivos.

Recupera la versión de Gemini Nano

Las diferentes versiones de Gemini Nano se ejecutan en diferentes dispositivos. Para devolver la versión de Gemini Nano en un dispositivo, usa getBaseModelName().

Cuota por aplicación

AICore aplica una cuota de inferencia por app. Si se realizan demasiadas solicitudes a la API de IA generativa en un período breve, se devolverá una respuesta ErrorCode.BUSY. Cuando recibas un error de este tipo, considera usar la retirada exponencial para reintentar la solicitud. Además, se puede devolver ErrorCode.PER_APP_BATTERY_USE_QUOTA_EXCEEDED si una app supera una cuota de larga duración (p.ej., una cuota diaria).

Uso en segundo plano

La inferencia de la API de IA generativa solo se permite cuando la app es la aplicación en primer plano principal. Si se usa la API cuando la app no está en primer plano, incluido el uso de un servicio en primer plano, se generará una respuesta ErrorCode.BACKGROUND_USE_BLOCKED.

Código de muestra

Para obtener este código, consulta los siguientes ejemplos: