Tổng quan về API GenAI của Bộ công cụ học máy

Các API GenAI của Bộ công cụ học máy khai thác sức mạnh của Gemini Nano để giúp ứng dụng của bạn thực hiện các tác vụ. Các API này cung cấp chất lượng ngay từ đầu cho các trường hợp sử dụng phổ biến thông qua một giao diện cấp cao. Các API GenAI của Bộ công cụ học máy được xây dựng dựa trên AICore, một dịch vụ hệ thống Android cho phép thực thi các mô hình nền tảng GenAI trên thiết bị để hỗ trợ các tính năng như nâng cao chức năng của ứng dụng và cải thiện quyền riêng tư của người dùng bằng cách xử lý dữ liệu cục bộ.

API GenAI của Bộ công cụ học máy hỗ trợ các tính năng sau:

  • Tóm tắt: Tóm tắt các bài viết hoặc cuộc trò chuyện dưới dạng danh sách có dấu đầu dòng.
  • Chính tả: Chỉnh sửa nội dung ngắn bằng cách tinh chỉnh ngữ pháp và sửa lỗi chính tả.
  • Viết lại: Viết lại tin nhắn ngắn theo nhiều giọng điệu hoặc phong cách.
  • Nội dung mô tả hình ảnh: Tạo nội dung mô tả ngắn về một hình ảnh nhất định.

Lợi ích của API GenAI

Tương tự như các tính năng khác hiện có trong Bộ công cụ học máy, API GenAI chạy hoàn toàn trên thiết bị và mang lại những lợi ích sau:

  • Dữ liệu đầu vào, suy luận và đầu ra được xử lý cục bộ
  • Chức năng vẫn giữ nguyên khi không có kết nối Internet đáng tin cậy
  • Không phát sinh thêm chi phí máy chủ cho mỗi lệnh gọi API

Ngoài ra, vì các API GenAI được xây dựng dựa trên AICore và được Gemini Nano hỗ trợ, nên mọi ứng dụng đều có thể sử dụng mô hình Gemini Nano dùng chung trên thiết bị. Điều này giúp bạn không phải chờ tải mô hình xuống nếu mô hình đó đã tồn tại trên thiết bị, từ đó tiết kiệm không gian lưu trữ. Tìm hiểu thêm về cách AICore tách biệt các yêu cầu để bảo vệ quyền riêng tư.

Phát trực tuyến so với không phát trực tuyến

API GenAI của Bộ công cụ học máy cung cấp cả tuỳ chọn phát trực tuyến và không phát trực tuyến để nhận kết quả. API truyền trực tuyến phân phối các phản hồi tăng dần khi các phản hồi đó được tạo, cung cấp luồng dữ liệu liên tục. Ngược lại, API không truyền trực tuyến sẽ đợi cho đến khi toàn bộ phản hồi hoàn tất rồi mới trả về dưới dạng một khối duy nhất.

Chọn API truyền trực tuyến cho các phản hồi dài, vì API này cho phép phản hồi ban đầu nhanh hơn. API không phát trực tuyến phù hợp hơn với các phản hồi ngắn hoặc khi xử lý kết quả theo lô.

Hỗ trợ về thiết bị

Các API GenAI của Bộ công cụ học máy có trên các thiết bị sau đây, với kế hoạch mở rộng hỗ trợ cho các thiết bị khác:

  • Google: Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL, Pixel 9 Pro Fold
  • Honor: Magic 7 Pro, Magic 7
  • iQOO: iQOO 13
  • Motorola: Razr 60 Ultra
  • OnePlus: OnePlus 13, OnePlus 13s
  • OPPO: Find N5, Find X8, Find X8 Pro
  • POCO: POCO F7 Ultra
  • realme: realme GT 7 Pro
  • Samsung: Galaxy S25, Galaxy S25+, Galaxy S25 Ultra
  • vivo: vivo X200, vivo X200 Pro
  • Xiaomi: Xiaomi 15 Ultra, Xiaomi 15

Khả năng hỗ trợ ngôn ngữ cụ thể có thể thay đổi tuỳ thuộc vào cấu hình của thiết bị cụ thể và các mô hình đã được tải xuống thiết bị.

Hạn mức cho mỗi ứng dụng

AICore thực thi hạn mức suy luận cho mỗi ứng dụng. Điều này có nghĩa là việc gửi quá nhiều yêu cầu API GenAI trong một khoảng thời gian ngắn sẽ dẫn đến phản hồi ErrorCode.BUSY. Khi gặp lỗi như vậy, hãy cân nhắc sử dụng thuật toán thời gian đợi luỹ thừa để thử lại yêu cầu.

Sử dụng ở chế độ nền

Chỉ được phép suy luận API GenAI khi ứng dụng là ứng dụng trên nền trước hàng đầu. Việc sử dụng API khi ứng dụng không chạy trên nền trước, bao gồm cả việc sử dụng dịch vụ trên nền trước, sẽ dẫn đến phản hồi ErrorCode.BUSY do hiện tại không có hạn mức sử dụng ở chế độ nền.

Mã mẫu

Để lấy mã này, hãy xem các mẫu sau: