Trang này chứa các thuật ngữ trong bảng chú giải về AI có khả năng hành động. Để xem tất cả các thuật ngữ trong bảng chú giải, hãy nhấp vào đây.
A
hành động
Một giai đoạn trong vòng lặp có tác nhân, trong đó tác nhân thực hiện hành động được chọn trong giai đoạn lý do. Ví dụ: giai đoạn hành động có thể gửi một yêu cầu API.
hành động
Trong học tăng cường, cơ chế mà tác nhân chuyển đổi giữa các trạng thái của môi trường. Tác nhân chọn hành động bằng cách sử dụng chính sách.
không gian hành động
Tập hợp các tài nguyên mà tác nhân có thể dùng để thực hiện một tác vụ. Không gian hành động có thể bao gồm các công cụ và API mà tác nhân có thể gọi và các quyền mà tác nhân nắm giữ. Nhìn chung, không gian thao tác chỉ cần đủ lớn để tác nhân thực hiện tác vụ. Nếu không gian hành động quá nhỏ, tác nhân có thể không có đủ tài nguyên để thực hiện nhiệm vụ. Nếu không gian hành động quá lớn, tác nhân có xu hướng dễ mắc lỗi hơn.
nhân viên hỗ trợ
Phần mềm có thể suy luận về thông tin đầu vào của người dùng để lên kế hoạch và thực hiện các hành động thay cho người dùng.
Trong học tăng cường, tác nhân là thực thể sử dụng một chính sách để tối đa hoá lợi nhuận dự kiến thu được từ việc chuyển đổi giữa các trạng thái của môi trường.
tác nhân
Dạng tính từ của agent. Agentic đề cập đến những phẩm chất mà các tác nhân sở hữu (chẳng hạn như tính tự chủ).
vòng lặp tác nhân
Một chu kỳ mà tác nhân lặp lại cho đến khi đáp ứng điều kiện chấm dứt. Chu kỳ này thường bao gồm 4 giai đoạn sau:
quy trình làm việc dựa trên tác nhân
Một quy trình linh hoạt trong đó tác nhân tự động lên kế hoạch và thực hiện các hành động để đạt được mục tiêu. Quy trình này có thể bao gồm suy luận, gọi các công cụ bên ngoài và tự điều chỉnh kế hoạch.
điều phối tác nhân
Việc quản lý và định tuyến tập trung các tác vụ trên nhiều tác nhân phụ hoặc lệnh gọi LLM. Điều phối tác nhân chia nhỏ các tác vụ phức tạp thành các tác vụ phụ nhỏ hơn và chỉ định các tác vụ đó cho các tác nhân phụ có khả năng cao nhất.
tác nhân tự trị
Một tác nhân hướng đến mục tiêu phức tạp bằng cách lập kế hoạch, hành động và thích ứng mà không cần sự can thiệp liên tục của con người.
E
tác nhân đánh giá
Một nhân viên đánh giá kết quả của một nhân viên khác trước khi kết quả đó được hoàn tất. Bạn có thể hình dung một tác nhân là sản xuất một sản phẩm và một tác nhân riêng biệt (tác nhân đánh giá) sẽ kiểm thử sản phẩm đó trước khi phát hành.
Người phê bình là từ đồng nghĩa với nhân viên đánh giá.
F
phản hồi
Một giai đoạn trong vòng lặp có tác nhân, trong đó tác nhân đánh giá hành động được thực hiện trong giai đoạn hành động. Ví dụ: nếu tác nhân gửi một yêu cầu API trong giai đoạn hành động, thì giai đoạn phản hồi có thể xác định xem phản hồi API có thành công hay không.
G
Các mô hình Gemini
Mô hình Transformer tiên tiến dựa trên mô hình đa phương thức của Google. Các mô hình Gemini được thiết kế riêng để tích hợp với các tác nhân.
Người dùng có thể tương tác với các mô hình Gemini theo nhiều cách, bao gồm cả thông qua giao diện hộp thoại tương tác và thông qua các SDK.
tác tử tạo sinh (bản sao)
Các đặc vụ được trang bị tính cách, ký ức và thói quen riêng biệt mô phỏng hành vi thực tế của con người.
Hãy xem bài viết Generative Agents: Interactive Simulacra of Human Behavior (Tác nhân tạo sinh: Mô phỏng tương tác hành vi của con người) để biết thông tin chi tiết.
M
tác nhân quản lý
Một tác nhân kiểm soát một hoặc nhiều tác nhân phụ.
cộng tác nhiều tác nhân
Một khung hình mà nhiều trợ lý AI chuyên dụng tương tác, tranh luận hoặc truyền nhiệm vụ cho nhau để giải quyết một vấn đề phức tạp.
O
observe
Một giai đoạn trong vòng lặp dựa trên tác nhân, trong đó tác nhân kiểm tra hoặc đánh giá một khía cạnh nào đó trong tiến trình của tác nhân. Ví dụ: giả sử giai đoạn act tạo ra một số mã. Do đó, giai đoạn observe có thể chạy các kiểm thử trên mã đã tạo.
Điểm
lập kế hoạch và giải quyết
Một chiến lược dựa trên tác nhân, trong đó mô hình này trước tiên sẽ phác thảo một kế hoạch rõ ràng gồm nhiều bước trước khi cố gắng thực hiện bất kỳ hành động nào.
trình bổ trợ
Một công cụ mô-đun, được tiêu chuẩn hoá và có thể dễ dàng gắn vào một tác nhân để mở rộng các chức năng của tác nhân đó. Ví dụ: một trình bổ trợ GitHub cho phép các tác nhân thực hiện những hành động như đọc vấn đề trên GitHub và tạo yêu cầu kéo.
trí nhớ về quy trình
Trong tác nhân, kiến thức về cách làm một việc gì đó. Ví dụ: một tác nhân có thể phát triển trí nhớ về quy trình cách tìm kiếm trên web rồi hiển thị 3 trang web hàng đầu.
Điểm
lý do
Một giai đoạn trong vòng lặp dựa trên tác nhân, trong đó tác nhân xác định việc cần làm. Ví dụ: tác nhân có thể xác định rằng một yêu cầu API cụ thể cần được gửi.
suy tư
Một chiến lược cải thiện chất lượng của quy trình làm việc dựa trên tác nhân bằng cách kiểm tra (suy nghĩ về) đầu ra của một bước trước khi chuyển đầu ra đó sang bước tiếp theo.
Trình kiểm tra thường là cùng một LLM đã tạo ra câu trả lời (mặc dù có thể là một LLM khác). Làm cách nào để cùng một LLM tạo ra câu trả lời lại có thể đánh giá công bằng câu trả lời của chính nó? "Mẹo" là đặt LLM vào một tư duy phản biện (phản tư). Quá trình này tương tự như một nhà văn sử dụng tư duy sáng tạo để viết bản thảo đầu tiên, sau đó chuyển sang tư duy phản biện để chỉnh sửa.
Ví dụ: hãy tưởng tượng một quy trình làm việc dựa trên tác nhân mà bước đầu tiên là tạo văn bản cho cốc cà phê. Lời nhắc cho bước này có thể là:
Bạn là một nhà sáng tạo. Tạo văn bản hài hước, độc đáo có tối đa 50 ký tự, phù hợp với cốc cà phê.
Bây giờ, hãy tưởng tượng câu lệnh phản chiếu sau:
Bạn là người uống cà phê. Bạn có thấy câu trả lời trước đó hài hước không?
Sau đó, quy trình làm việc có thể chỉ chuyển văn bản nhận được điểm phản chiếu cao sang giai đoạn tiếp theo.
tác nhân bộ định tuyến
Một tác nhân phân loại truy vấn của người dùng, sau đó gọi tác nhân phù hợp nhất để xử lý truy vấn đó.
N
tự sửa lỗi
Khả năng phát hiện lỗi trong đầu ra của chính nó và sau đó thử một phương pháp khác của một tác nhân.
tiểu bang
Trong học tăng cường, các giá trị tham số mô tả cấu hình hiện tại của môi trường mà tác nhân sử dụng để chọn một hành động.
tác nhân máy trạng thái
Một nhân viên hỗ trợ có quy trình làm việc bị hạn chế bởi các quy tắc cứng nhắc. Các tác nhân máy trạng thái thường ít mắc lỗi hơn các tác nhân tự trị nhưng không có quyền tự do thích ứng với các tình huống nằm ngoài các ràng buộc của chúng.
đại lý phụ
Một mô hình chuyên biệt, tập trung hẹp được một tác nhân quản lý gọi để xử lý một tập hợp con cụ thể của một vấn đề lớn hơn. Các tác nhân phụ thường có không gian hành động hẹp hơn so với các tác nhân.
T
điều kiện chấm dứt
Trong AI dựa trên tác nhân, các tiêu chí được xác định trước sẽ cho biết tác nhân cần dừng lặp lại. Ví dụ: sau đây là một số điều kiện chấm dứt có thể xảy ra:
- Tác nhân đã hoàn thành mục tiêu.
- Tác nhân không thể sử dụng thêm tài nguyên nào nữa.
- Một human-in-the-loop đã phát hiện thấy một vấn đề.
Trong học tăng cường, các điều kiện xác định thời điểm kết thúc một tập, chẳng hạn như khi tác nhân đạt đến một trạng thái nhất định hoặc vượt quá ngưỡng số lượng chuyển đổi trạng thái. Ví dụ: trong trò chơi tic-tac-toe (còn được gọi là trò chơi đánh dấu ô), một tập sẽ kết thúc khi người chơi đánh dấu 3 ô liên tiếp hoặc khi tất cả các ô đều được đánh dấu.