Chế độ tác nhân

Tài liệu này mô tả chế độ tác nhân trong Gemini Code Assist.

Chế độ tác nhân có trong môi trường phát triển tích hợp (IDE) của VS Code. Để bắt đầu sử dụng chế độ trợ lý, hãy xem phần Sử dụng tính năng trò chuyện dựa trên trợ lý ảo làm lập trình viên cặp.

Chế độ tác nhân trong VS Code được hỗ trợ bởi Gemini CLI.

Ở chế độ đại lý, bạn có thể làm những việc sau đây và nhiều việc khác:

  • Đặt câu hỏi về mã của bạn.
  • Sử dụng bối cảnh và các công cụ tích hợp để cải thiện nội dung được tạo.
  • Định cấu hình các máy chủ MCP để mở rộng khả năng của tác nhân.
  • Nhận giải pháp cho các tác vụ phức tạp có nhiều bước.
  • Tạo mã từ tài liệu thiết kế, vấn đề và nhận xét TODO.
  • Kiểm soát hành vi của trợ lý bằng cách nhận xét, chỉnh sửa và phê duyệt kế hoạch cũng như việc sử dụng công cụ trong quá trình thực thi.

Cách hoạt động của chế độ tác nhân

Ở chế độ tác nhân, câu lệnh của bạn sẽ được gửi đến Gemini API cùng với danh sách công cụ hiện có. Gemini API xử lý câu lệnh và trả về câu trả lời. Câu trả lời có thể là câu trả lời trực tiếp hoặc yêu cầu sử dụng một công cụ có sẵn.

Khi một công cụ được yêu cầu, tác nhân sẽ chuẩn bị sử dụng công cụ đó và kiểm tra xem tác nhân có được phép sử dụng công cụ đó hay không, cho dù có hoặc không có sự cho phép rõ ràng:

  • Đối với những yêu cầu về công cụ sửa đổi hệ thống tệp hoặc thực hiện các thao tác đột biến trên bất kỳ tài nguyên nào, Gemini sẽ yêu cầu bạn cho phép thao tác đó, trừ phi bạn đã định cấu hình Gemini để luôn cho phép (các) công cụ.
  • Các yêu cầu về công cụ ở chế độ chỉ đọc có thể không yêu cầu cấp quyền trước khi hoàn tất tác vụ.

Khi được yêu cầu cho phép sử dụng một công cụ, bạn có thể chọn cho phép hoặc từ chối thao tác này. Tác nhân cũng có thể cung cấp cho bạn các lựa chọn để luôn cho phép một công cụ hoặc máy chủ hoặc cho phép các thao tác tương tự. Để biết thêm thông tin, hãy xem phần Luôn cho phép các thao tác của tác nhân.

Sau khi được cấp quyền sử dụng công cụ hoặc tự cấp quyền, tác nhân sẽ sử dụng công cụ này để hoàn tất hành động cần thiết và kết quả của hành động đó sẽ được gửi lại cho Gemini API. Gemini xử lý kết quả của thao tác bằng công cụ và tạo một câu trả lời khác. Chu trình hành động và đánh giá này tiếp tục cho đến khi nhiệm vụ hoàn tất.

Đối với những công việc phức tạp, Gemini có thể cho bạn xem kế hoạch tổng thể để bạn phê duyệt. Bạn có thể điều chỉnh kế hoạch và đặt câu hỏi trong cuộc trò chuyện trước khi bắt đầu quy trình. Sau khi hài lòng với kế hoạch, bạn có thể phê duyệt kế hoạch đó. Sau khi bạn phê duyệt kế hoạch, tác nhân sẽ bắt đầu thực hiện nhiệm vụ đầu tiên và sẽ yêu cầu bạn giải thích rõ hơn hoặc cấp quyền khi cần trong quá trình thực hiện kế hoạch.

Ngữ cảnh ở chế độ tác nhân

Ngữ cảnh cho phép một tác nhân tạo ra câu trả lời phù hợp hơn cho một câu lệnh nhất định. Bạn có thể lấy bối cảnh từ các tệp trong IDE, các tệp trong thư mục hệ thống cục bộ, các câu trả lời của công cụ và thông tin chi tiết về câu lệnh.

Tuỳ thuộc vào IDE và chế độ cài đặt của bạn, có thể có nhiều bối cảnh khác nhau cho tác nhân.

Các thẻ sau đây trình bày chi tiết cách thu thập bối cảnh cho các IDE khác nhau.

VS Code

Gemini Code Assist ở chế độ tác nhân thường có thể sử dụng các phương thức sau để lấy bối cảnh:

  • Thông tin trong không gian làm việc IDE.
  • Câu trả lời của công cụ từ các công cụ tích hợp như grep, thiết bị đầu cuối, đọc tệp hoặc ghi tệp.
  • Câu trả lời của Google Tìm kiếm.
  • Nội dung từ một URL nhất định được cung cấp trong câu lệnh hoặc bằng một công cụ.
  • Tệp bối cảnh bạn tạo bằng Markdown.

Bộ nhớ của nhân viên hỗ trợ

Chế độ tác nhân Gemini Code Assist trong VS Code tận dụng dịch vụ khám phá bộ nhớ Gemini CLI để tìm và tải các tệp GEMINI.md cung cấp ngữ cảnh cho tác nhân. Dịch vụ khám phá bộ nhớ sẽ tìm kiếm các tệp này theo thứ bậc, bắt đầu từ thư mục đang hoạt động hiện tại và di chuyển lên thư mục gốc của dự án và thư mục chính của bạn. Công cụ này cũng tìm kiếm trong các thư mục con.

Bạn có thể tạo các tệp ngữ cảnh ở cấp độ chung, cấp độ dự án và cấp độ thành phần. Tất cả các tệp này được kết hợp để cung cấp cho mô hình thông tin phù hợp nhất.

Bạn có thể sử dụng lệnh /memory show để xem nội dung kết hợp của tất cả các tệp GEMINI.md đã tải và lệnh /memory refresh để tải lại các tệp đó.

Tiện ích Gemini CLI

Bạn có thể sử dụng các tiện ích Gemini CLI để định cấu hình và mở rộng chức năng chế độ tác nhân Gemini Code Assist.

Tác nhân tìm kiếm các tiện ích ở hai vị trí:

  • WORKSPACE/.gemini/extensions trong đó WORKSPACE là không gian làm việc hiện tại của bạn.
  • ~/.gemini/extensions, trong đó ~ là thư mục chính của bạn.

Tác nhân tải tất cả các tiện ích từ cả hai vị trí, nhưng nếu có một tiện ích có cùng tên ở cả hai vị trí, thì tiện ích trong thư mục không gian làm việc sẽ được ưu tiên. Mỗi tiện ích là một thư mục chứa tệp gemini-extension.json. Tệp này chứa cấu hình cho tiện ích.

Để biết thêm thông tin, hãy xem bài viết Tiện ích Gemini CLI.

IntelliJ

Gemini Code Assist không hỗ trợ tính năng này trong IntelliJ hoặc các IDE khác của JetBrains.

Công cụ

Công cụ là một danh mục rộng gồm các dịch vụ mà một tác nhân có thể sử dụng cho ngữ cảnh và hành động trong phản hồi của tác nhân đối với câu lệnh của bạn. Một số ví dụ về công cụ là các công cụ tích hợp như grep và đọc hoặc ghi tệp, máy chủ Giao thức bối cảnh mô hình (MCP) cục bộ hoặc từ xa và các hàm thực thi của chúng, cũng như các triển khai dịch vụ riêng.

Bước tiếp theo