Tổng quan

SDK Trợ lý Google cho phép bạn thêm các chế độ điều khiển bằng giọng nói, khả năng hiểu ngôn ngữ tự nhiên và các tính năng thông minh của Google vào ý tưởng của bạn. Dự án của bạn sẽ ghi lại một lời nói (một yêu cầu bằng giọng nói, chẳng hạn như Lịch của tôi có gì?), gửi cho Trợ lý Google và nhận phản hồi bằng giọng nói qua giọng nói ngoài văn bản thô của lời nói.

Dịch vụ Trợ lý Google

Dịch vụ Trợ lý Google sẽ hiển thị API cấp thấp cho phép bạn thao tác trực tiếp các byte âm thanh của yêu cầu và phản hồi của Trợ lý. Bạn có thể tạo liên kết cho API này cho các ngôn ngữ như Node.js, Go, C++, Java cho tất cả các nền tảng hỗ trợ gRPC.

Mã tham chiếu được cung cấp trong Python để ghi âm, phát lại âm thanh và quản lý trạng thái cuộc trò chuyện.

Khả năng tương thích và hỗ trợ tính năng

Bảng sau đây tóm tắt các yêu cầu về khả năng tương thích với nền tảng của Dịch vụ Trợ lý Google:

Dịch vụ Trợ lý Google
Cấu trúc được hỗ trợ Tất cả các nền tảng GRPC
Ngôn ngữ được hỗ trợ Tất cả các ngôn ngữ trong gRPC
Kích hoạt rảnh tay
(Ok Google)
Không
Ghi và phát lại âm thanh Mã tham chiếu được cung cấp
Quản lý trạng thái cuộc trò chuyện Mã tham chiếu được cung cấp
Hẹn giờ và báo thứcKhông
Phát lại podcast và tin tứcKhông
Phát đi thông báo bằng giọng nóiKhông
Hình ảnh đầu ra (HTML5) trong phản hồi của Trợ lý

Các bước để bắt đầu xây dựng dự án

SDK cho phép bạn xây dựng dự án nhanh chóng bằng cách nhúng Trợ lý Google rồi cho phép bạn thêm chức năng độc đáo với Actions on Google:

  1. Xây dựng dự án bằng API gRPC.
  2. Nhận ý tưởng cho các bước tiếp theo để tùy chỉnh.
  3. Hoàn thiện dự án của bạn bằng cách đọc các phương pháp hay nhất về quyền riêng tư và bảo mật cũng như cấu hình âm thanh.