Режим агента

В этом документе описывается режим агента в Gemini Code Assist.

Режим агента доступен в интегрированной среде разработки (IDE) VS Code. Чтобы начать использовать режим агента, см. статью Использование агентского чата в качестве парного программиста .

Режим агента в VS Code работает на базе Gemini CLI .

В режиме агента вы можете выполнять любые из следующих действий и многое другое:

  • Задавайте вопросы о своем коде.
  • Используйте контекст и встроенные инструменты для улучшения создаваемого контента.
  • Настройте MCP-серверы для расширения возможностей агента.
  • Получайте решения сложных задач, состоящие из нескольких шагов.
  • Создавайте код на основе проектной документации, проблем и комментариев TODO .
  • Управляйте поведением агента, комментируя, редактируя и утверждая планы и использование инструментов во время выполнения.

Как работает режим агента

В режиме агента ваш запрос отправляется в API Gemini со списком доступных инструментов . API Gemini обрабатывает запрос и возвращает ответ. Ответ может быть прямым ответом или запросом на использование доступного инструмента.

При запросе инструмента агент готовится использовать его и проверяет, разрешено ли использовать инструмент с явным разрешением или без него:

  • Для запросов инструментов, которые изменяют файловую систему или выполняют операции по мутации каких-либо ресурсов, Gemini попросит вас разрешить операцию, если только вы не настроили Gemini так, чтобы он всегда разрешал выполнение инструмента или инструментов.
  • Запросы инструментов, доступные только для чтения, могут не запрашивать разрешение перед выполнением задачи.

При запросе разрешения на использование инструмента вы можете разрешить или запретить эту операцию. Агент также может предоставить вам возможность всегда разрешать использование инструмента или сервера, а также разрешать аналогичные операции. Подробнее см. в разделе «Всегда разрешать действия агента» .

После получения разрешения на использование инструмента или самостоятельного предоставления разрешения агент использует инструмент для выполнения требуемого действия, и результат этого действия отправляется обратно в API Gemini. Gemini обрабатывает результат действия инструмента и генерирует другой ответ. Этот цикл действий и оценки продолжается до завершения задачи.

Для сложных задач Gemini может предоставить вам на утверждение общий план. Вы можете доработать план и задать вопросы в чате перед началом процесса. Если план вас устроит, вы можете его утвердить. После утверждения плана агент приступает к работе над первой задачей и будет запрашивать у вас разъяснения или разрешения по мере необходимости.

Контекст режима агента

Контекст позволяет агенту генерировать более точные ответы на заданные запросы. Контекст может быть взят из файлов в вашей IDE, файлов в локальных системных папках, ответов инструментов и информации о ваших запросах.

В зависимости от вашей IDE и настроек агенту могут быть доступны разные контексты.

На следующих вкладках подробно описано, как собирается контекст для различных IDE.

VS Код

Для Gemini Code Assist в режиме агента обычно доступны следующие методы получения контекста:

  • Информация в вашем рабочем пространстве IDE.
  • Ответы встроенных инструментов, таких как grep, терминал, чтение файла или запись файла.
  • Ответы поиска Google.
  • Контент с указанного URL-адреса, предоставленный в подсказке или с помощью инструмента.
  • Контекстные файлы, создаваемые в Markdown.

Память агента

Режим агента Gemini Code Assist в VS Code использует службу обнаружения памяти Gemini CLI для поиска и загрузки файлов GEMINI.md , предоставляющих контекст для агента. Служба обнаружения памяти выполняет иерархический поиск этих файлов, начиная с текущего рабочего каталога и далее к корневому каталогу проекта и вашему домашнему каталогу. Поиск также выполняется в подкаталогах.

Вы можете создавать файлы контекста на глобальном уровне, на уровне проекта и на уровне компонента, которые объединяются для предоставления модели наиболее релевантной информации.

Вы можете использовать команду /memory show , чтобы просмотреть объединенное содержимое всех загруженных файлов GEMINI.md , и команду /memory refresh , чтобы перезагрузить их.

Расширения Gemini CLI

Для настройки и расширения функциональности режима агента Gemini Code Assist можно использовать расширения Gemini CLI.

Агент ищет расширения в двух местах:

  • WORKSPACE /.gemini/extensions , где WORKSPACE — ваше текущее рабочее пространство.
  • ~/.gemini/extensions где ~ — ваш домашний каталог.

Агент загружает все расширения из обоих мест, но если расширение с одинаковым именем существует в обоих местах, приоритет будет иметь расширение из каталога рабочей области. Каждое расширение — это каталог, содержащий файл gemini-extension.json . Этот файл содержит конфигурацию расширения.

Более подробную информацию можно найти в разделе Расширения Gemini CLI .

IntelliJ

Эта функция не поддерживается в Gemini Code Assist для IntelliJ или других IDE JetBrains.

Инструменты

Инструменты — это обширная категория сервисов, которые агент может использовать для контекста и действий в ответ на ваш запрос. Примерами таких инструментов являются встроенные инструменты, такие как grep и чтение/запись файлов, локальные или удалённые серверы Model Context Protocol (MCP) и их исполняемые функции, а также специализированные реализации сервисов.

Что дальше?