ML Kit 的 GenAI API 利用 Gemini Nano 的强大功能,帮助您的应用执行任务。这些 API 通过高级接口为常见用例提供开箱即用的质量。ML Kit GenAI API 基于 AICore 构建而成,AICore 是一项 Android 系统服务,可支持在设备端执行 GenAI 基础模型,以便通过在本地处理数据来实现增强型应用功能和增强用户隐私保护等功能。
ML Kit GenAI API 支持以下功能:
GenAI API 的优势
与其他现有机器学习套件功能类似,GenAI API 完全在设备端运行,因此具有以下优势:
- 输入、推理和输出数据在本地处理
- 在没有可靠互联网连接的情况下,功能保持不变
- 每次 API 调用都不会产生额外的服务器费用
此外,由于 GenAI API 基于 AICore 构建且由 Gemini Nano 提供支持,因此每款应用都可以使用设备端的共享 Gemini Nano 模型。这样,如果模型已在设备上存在,则无需等待下载,从而节省存储空间。详细了解 AICore 如何隔离请求以保护隐私。
流式传输与非流式传输
机器学习套件 GenAI API 提供流式和非流式选项来接收结果。流式 API 会在响应生成时逐步传送响应,从而提供连续的数据流。与之相反,非流式 API 会等到整个响应完成,然后将其作为单个分块返回。
如需提供长篇幅的回答,请选择流式传输 API,因为它可以更快地提供初始反馈。非流式 API 更适合处理简短响应或批量处理结果。
设备支持
ML Kit GenAI API 适用于以下设备,我们计划将支持范围扩大到更多设备:
- Google:Pixel 9、Pixel 9 Pro、Pixel 9 Pro XL、Pixel 9 Pro Fold
- 荣耀:Magic 7 Pro、Magic 7
- iQOO:iQOO 13
- Motorola:Razr 60 Ultra
- OnePlus:OnePlus 13、OnePlus 13s
- OPPO:Find N5、Find X8、Find X8 Pro
- POCO:POCO F7 Ultra
- realme:realme GT 7 Pro
- 三星:Galaxy S25、Galaxy S25+、Galaxy S25 Ultra
- vivo:vivo X200、vivo X200 Pro
- 小米:Xiaomi 15 Ultra、Xiaomi 15
特定语言的支持情况可能会因具体设备的配置和已下载到设备的模型而异。
每个应用的配额
AICore 会强制执行每个应用的推理配额。这意味着,如果在短时间内发出过多 GenAI API 请求,将会导致 ErrorCode.BUSY
响应。收到此类错误时,请考虑使用指数退避算法重试请求。
后台使用
只有当应用是主要的前台应用时,才允许进行 GenAI API 推理。由于目前缺少后台使用配额,因此在应用不在前台运行时使用该 API(包括使用前台服务)会导致 ErrorCode.BUSY
响应。
示例代码
如需获取此代码,请查看以下示例: