Các phương pháp hay nhất để hiểu ngôn ngữ tự nhiên

Trang này trình bày một số phương pháp hay nhất và đề xuất về ngôn ngữ tự nhiên (NLU) để tạo Hành động chất lượng cao.

Giải pháp chung

  • Cuộc trò chuyện và tương tác bằng lời nói có thể có nhiều hình thức và việc thu thập dữ liệu người dùng sớm có thể giúp Hành động của bạn hữu ích, hiệu quả và thú vị hơn.
  • Hãy chú ý đến các lỗi và cảnh báo. Ngay cả khi Hành động của bạn đang hoạt động bình thường, thì nó có thể gây ra vấn đề trong tương lai và bạn sẽ dành nhiều thời gian hơn để tìm hiểu vấn đề.

Ý định

  • Sử dụng lại ý định giữa các cảnh nhiều nhất có thể. Nếu có nhiều ý định có thể khớp, thì người dùng sẽ khó có thể khớp với ý định mà họ muốn, và thậm chí còn khó hơn để Trợ lý Google chọn đúng ý định dựa trên hoạt động đầu vào của người dùng.
  • Xây dựng các cụm từ huấn luyện ý định, bắt đầu bằng những yêu cầu hoặc luồng tương tác phổ biến nhất cho Hành động.
  • Hãy nghĩ về một số trường hợp cực đoan cho các cụm từ huấn luyện của bạn, như các truy vấn ngắn nhất và dài nhất được chấp nhận.
  • Số lượng cụm từ huấn luyện mà bạn thêm vào ý định phụ thuộc vào độ phức tạp và phạm vi của ý định dự kiến sẽ xử lý. Tức là bạn có thể dùng tối đa 5 cụm từ để hiểu một cách đơn giản ("yes" hoặc "no"), nhưng bạn có thể thêm hàng trăm cụm từ huấn luyện cho các mô hình ngôn ngữ phức tạp hơn.
  • Đối với các ý định phức tạp (có thể thay đổi theo hoạt động đầu vào của người dùng), hãy cung cấp nhiều cụm từ huấn luyện cần thiết để bao gồm tất cả phản hồi tiềm năng của người dùng.
  • Nếu bạn cần thu thập dữ liệu cụ thể từ người dùng, hãy sử dụng chức năng lấp đầy vị trí.
  • Không tạo ý định chỉ chứa các tham số ý định dạng văn bản tự do. Nếu bạn cần khớp mọi nội dung trong hoạt động đầu vào của người dùng, hãy sử dụng tính năng điền vị trí hoặc ý định của hệ thống NO_MATCH.

Loại

  • Nếu loại từ đồng nghĩa của bạn bao gồm nhiều từ, chẳng hạn như tên bài hát hoặc các món ăn, hãy cân nhắc việc bật tính năng so khớp mờ. Phương pháp này cho phép người dùng bỏ qua các từ không quan trọng hoặc thay đổi thứ tự nhập dự kiến.
  • Tránh sử dụng lựa chọn Chấp nhận giá trị không xác định bất cứ khi nào có thể bằng cách cung cấp thêm các từ đồng nghĩa.
  • Nếu bạn sử dụng tuỳ chọn Chấp nhận giá trị không xác định cho loại của mình, hãy cung cấp các cụm từ huấn luyện khác nhau để đảm bảo Trợ lý có thể xác định thông tin chính xác. Ví dụ: nếu bạn có loại message được đặt thành Chấp nhận các giá trị không xác định, thì các cụm từ huấn luyện của bạn có thể trông giống như sau:

    • Send $message
    • Send $message to Tim
    • Send mom $message
  • Nếu bạn cần so khớp mã nhận dạng hoặc thông tin đầu vào có cấu trúc khác, hãy cân nhắc sử dụng biểu thức chính quy.

  • Sử dụng lựa chọn Văn bản tuỳ ý một cách thận trọng. Tuỳ chọn này khớp với mọi dữ liệu nhập không trống và gây khó khăn cho trình xử lý ngôn ngữ trong việc huấn luyện và so khớp dữ liệu một cách hiệu quả. Bạn nên sử dụng tính năng này làm phương án cuối cùng, khi bạn chỉ đơn giản là không thể dự đoán những gì người dùng có thể nói.