Tổng quan về API GenAI của Bộ công cụ học máy

Các API GenAI của Bộ công cụ học máy khai thác sức mạnh của Gemini Nano để giúp các ứng dụng của bạn thực hiện các tác vụ. Các API này cung cấp chất lượng sẵn có cho các trường hợp sử dụng phổ biến thông qua một giao diện cấp cao. Các API GenAI của Bộ công cụ học máy được xây dựng dựa trên AICore, một dịch vụ hệ thống Android cho phép thực thi các mô hình nền tảng AI tạo sinh trên thiết bị để hỗ trợ các tính năng như chức năng của ứng dụng nâng cao và cải thiện quyền riêng tư của người dùng bằng cách xử lý dữ liệu cục bộ.

Điều khoản dịch vụ bổ sung của API GenAI của Bộ công cụ học máy được áp dụng cho việc sử dụng các API GenAI. Nhà phát triển chịu trách nhiệm hoàn toàn về sự an toàn của ứng dụng khách API và trải nghiệm người dùng của ứng dụng.

Các tính năng chính

Các API GenAI của Bộ công cụ học máy hỗ trợ những tính năng sau:

  • Tóm tắt: Tóm tắt các bài viết hoặc cuộc trò chuyện dưới dạng danh sách có dấu đầu dòng.
  • Hiệu đính: Chỉnh sửa nội dung ngắn bằng cách tinh chỉnh ngữ pháp và sửa lỗi chính tả.
  • Viết lại: Viết lại tin nhắn ngắn theo nhiều giọng điệu hoặc phong cách.
  • Nội dung mô tả hình ảnh: Tạo nội dung mô tả ngắn về một hình ảnh nhất định.
  • Nhận dạng lời nói: Chuyển nội dung âm thanh thành văn bản.
  • Câu lệnh: Tạo nội dung văn bản dựa trên câu lệnh tuỳ chỉnh chỉ có văn bản hoặc câu lệnh đa phương thức.

Lợi ích của API AI tạo sinh

Tương tự như các tính năng hiện có khác của Bộ công cụ học máy, các API GenAI chạy hoàn toàn trên thiết bị và do đó mang lại những lợi ích sau:

  • Dữ liệu đầu vào, dữ liệu suy luận và dữ liệu đầu ra được xử lý trên thiết bị
  • Chức năng vẫn giữ nguyên khi không có kết nối Internet ổn định
  • Không mất thêm chi phí máy chủ cho mỗi lệnh gọi API

Ngoài ra, vì các API GenAI được xây dựng dựa trên AICore và sử dụng Gemini Nano, nên mọi ứng dụng đều có thể sử dụng mô hình Gemini Nano dùng chung trên thiết bị. Điều này giúp bạn không cần phải đợi tải một mô hình xuống nếu mô hình đó đã có trên thiết bị, nhờ đó tiết kiệm được dung lượng lưu trữ. Tìm hiểu thêm về cách AICore tách biệt các yêu cầu để bảo vệ quyền riêng tư.

Truyền trực tuyến so với không truyền trực tuyến

Các API GenAI của Bộ công cụ học máy cung cấp cả lựa chọn truyền trực tuyến và không truyền trực tuyến để nhận kết quả. API truyền trực tuyến cung cấp các phản hồi tăng dần khi chúng được tạo, mang đến một luồng dữ liệu liên tục. Ngược lại, API không truyền trực tuyến sẽ đợi cho đến khi toàn bộ phản hồi hoàn tất rồi mới trả về phản hồi đó dưới dạng một khối duy nhất.

Chọn API phát trực tuyến cho các phản hồi dài vì API này cho phép nhận được ý kiến phản hồi ban đầu nhanh hơn. API không truyền trực tuyến phù hợp hơn với các phản hồi ngắn hoặc khi xử lý kết quả theo lô.

Hỗ trợ về thiết bị

Các API dành riêng cho tính năng GenAI (Tóm tắt, Hiệu đính, Viết lại và Mô tả hình ảnh) có khả năng hỗ trợ thiết bị khác với Prompt API, như mô tả trong các phần sau.

Hỗ trợ thiết bị API theo tính năng

Các API Tóm tắt, Hiệu đính, Viết lạiMô tả hình ảnh có trên các thiết bị sau đây, đồng thời chúng tôi có kế hoạch mở rộng phạm vi hỗ trợ sang các thiết bị khác:

  • Google: Pixel 10, Pixel 10 Pro, Pixel 10 Pro XL, Pixel 10 Pro Fold, Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL, Pixel 9 Pro Fold
  • Honor: Honor 400 Pro, Magic 7, Magic 7 Pro, Magic 8 Pro, Magic V5
  • iQOO: iQOO 13, iQOO 15
  • Motorola: Razr 60 Ultra, Razr Ultra 2025, Signature
  • OnePlus: OnePlus 15, OnePlus 15R, OnePlus 13, OnePlus 13s
  • OPPO: Find N5, Find X9, Find X9 Pro, Find X8, Find X8 Pro, Reno 14 Pro 5G, Reno 15 Pro 5G, Reno 15 Pro Mini 5G, Reno 15 Pro Max 5G
  • POCO: POCO F7 Ultra, POCO F8 Pro, POCO F8 Ultra, POCO X7 Pro, POCO X8 Pro
  • realme: realme GT 7 Pro, realme GT 7T
  • Samsung: Galaxy S25, Galaxy S25+, Galaxy S25 Ultra, Galaxy S26, Galaxy S26+, Galaxy S26 Ultra, Galaxy Z Fold7, Galaxy Z TriFold
  • vivo: vivo X200T, vivo X200 FE, vivo X200, vivo X200 Pro, vivo X300, X300 Pro, vivo X Fold3 Pro, vivo X Fold5, vivo T4 Ultra
  • Xiaomi: Xiaomi 14T Pro, Xiaomi 15, Xiaomi 15T, Xiaomi 15T Pro, Xiaomi 15 Ultra, Xiaomi 17, Xiaomi 17 Ultra, Xiaomi Pad Mini

Phạm vi hỗ trợ ngôn ngữ cụ thể có thể thay đổi tuỳ theo cấu hình của thiết bị cụ thể và các mô hình đã được tải xuống thiết bị.

Hỗ trợ thiết bị Prompt API

Prompt API được hỗ trợ trên các thiết bị sau:

nano-v2

  • Google: Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL, Pixel 9 Pro Fold
  • Honor: Magic V5, Magic 7, Magic 7 Pro
  • iQOO: iQOO 13
  • Motorola: Razr 60 Ultra, Razr Ultra 2025
  • OnePlus: OnePlus 13, OnePlus 13s
  • OPPO: Find N5
  • POCO: POCO F7 Ultra, POCO F8 Pro, POCO F8 Ultra, POCO X7 Pro, POCO X8 Pro
  • realme: realme GT 7 Pro
  • Samsung: Galaxy Z Fold7, Galaxy Z TriFold
  • Xiaomi: Xiaomi 14T Pro, Xiaomi 15, Xiaomi 15T, Xiaomi 15T Pro, Xiaomi 15 Ultra, Xiaomi 17, Xiaomi 17 Ultra, Xiaomi Pad Mini
  • vivo: vivo X200 FE, vivo T4 Ultra

nano-v3

  • Google: Pixel 10, Pixel 10 Pro, Pixel 10 Pro XL, Pixel 10 Pro Fold
  • Honor: Honor Magic 8 Pro
  • iQOO: iQOO 15
  • Motorola: Signature
  • OnePlus: OnePlus 15, OnePlus 15R
  • OPPO: Find X9, Find X9 Pro, Find X8, Find X8 Pro, Reno 14 Pro 5G, Reno 15 Pro 5G, Reno 15 Pro Mini 5G, Reno 15 Pro Max 5G
  • realme: realme GT 7T
  • Samsung: Galaxy S26, Galaxy S26+, Galaxy S26 Ultra
  • vivo: vivo X200T, vivo X200, vivo X200 Pro, vivo X300, vivo X300 Pro

Hỗ trợ thiết bị cho Speech Recognition API

Speech Recognition API được hỗ trợ trên các thiết bị sau:

Chế độ cơ bản Sử dụng mô hình nhận dạng giọng nói truyền thống trên thiết bị, có trên hầu hết các thiết bị Android có cấp độ API 31 trở lên.
Chế độ nâng cao Tận dụng mô hình AI tạo sinh để có chất lượng cao hơn và phạm vi ngôn ngữ rộng hơn. Được các thiết bị Pixel 10 hỗ trợ và sẽ có thêm nhiều thiết bị khác trong quá trình phát triển.

Truy xuất phiên bản Gemini Nano

Các phiên bản Gemini Nano khác nhau sẽ chạy trên các thiết bị khác nhau. Để trả về phiên bản Gemini Nano trên một thiết bị, hãy dùng getBaseModelName().

Hạn mức cho mỗi ứng dụng

AICore áp dụng hạn mức suy luận cho mỗi ứng dụng. Việc gửi quá nhiều yêu cầu GenAI API trong một khoảng thời gian ngắn sẽ dẫn đến phản hồi ErrorCode.BUSY. Khi gặp phải lỗi như vậy, hãy cân nhắc sử dụng thuật toán thời gian đợi luỹ thừa để thử lại yêu cầu. Ngoài ra, ErrorCode.PER_APP_BATTERY_USE_QUOTA_EXCEEDED có thể được trả về nếu một ứng dụng vượt quá hạn mức dài hạn (ví dụ: hạn mức hằng ngày).

Mức sử dụng ở chế độ nền

Bạn chỉ được phép suy luận bằng GenAI API khi ứng dụng là ứng dụng trên nền trước hàng đầu. Việc sử dụng API khi ứng dụng không ở trên nền trước (kể cả khi sử dụng một dịch vụ trên nền trước) sẽ dẫn đến phản hồi ErrorCode.BACKGROUND_USE_BLOCKED.

Mã mẫu

Để lấy mã này, hãy xem các mẫu sau: