Ten dokument opisuje tryb agenta w Gemini Code Assist.
Tryb agenta jest dostępny w zintegrowanym środowisku programistycznym (IDE) VS Code. Aby zacząć korzystać z trybu agenta, przeczytaj artykuł Korzystanie z czatu z agentem jako programista pracujący w parze.
Tryb agenta w VS Code jest obsługiwany przez Gemini CLI.
W trybie agenta możesz m.in.:
- zadawać pytania dotyczące kodu;
- Używaj kontekstu i wbudowanych narzędzi, aby ulepszać wygenerowane treści.
- Skonfiguruj serwery MCP, aby rozszerzyć możliwości agenta.
- Uzyskuj rozwiązania złożonych zadań składających się z wielu etapów.
- Generowanie kodu na podstawie dokumentów projektowych, zgłoszeń i
TODO
komentarzy. - Kontroluj działanie agenta, komentując, edytując i zatwierdzając plany oraz korzystanie z narzędzi podczas wykonywania zadań.
Jak działa tryb agenta
W trybie agenta prompt jest wysyłany do interfejsu Gemini API wraz z listą dostępnych narzędzi. Interfejs Gemini API przetwarza prompta i zwraca odpowiedź. Odpowiedź może być bezpośrednia lub może zawierać prośbę o użycie dostępnego narzędzia.
Gdy narzędzie jest wymagane, agent przygotowuje się do jego użycia i sprawdza, czy może to zrobić za zgodą użytkownika lub bez niej:
- W przypadku próśb o narzędzia, które modyfikują system plików lub wykonują operacje zmieniające stan zasobów, Gemini poprosi Cię o zezwolenie na operację, chyba że skonfigurujesz Gemini tak, aby zawsze zezwalał na użycie danego narzędzia lub narzędzi.
- Żądania narzędzi w trybie tylko do odczytu mogą nie wymagać pozwolenia przed wykonaniem zadania.
Gdy pojawi się prośba o zezwolenie na użycie narzędzia, możesz zezwolić na operację lub jej odmówić. Agent może też zaproponować opcje, które pozwolą zawsze zezwalać na używanie narzędzia lub serwera albo na podobne działania. Więcej informacji znajdziesz w artykule Zawsze zezwalaj na działania agenta.
Gdy użytkownik przyzna lub sam sobie przyzna uprawnienia do korzystania z narzędzia, agent używa go do wykonania wymaganego działania, a wynik tego działania jest odsyłany do interfejsu Gemini API. Gemini przetwarza wynik działania narzędzia i generuje kolejną odpowiedź. Ten cykl działań i ocen trwa do momentu ukończenia zadania.
W przypadku złożonych zadań Gemini może wyświetlić ogólny plan do zatwierdzenia. Przed rozpoczęciem procesu możesz dopracować plan i zadać pytania na czacie. Gdy uznasz, że plan jest odpowiedni, możesz go zatwierdzić. Gdy zatwierdzisz plan, agent rozpocznie pracę nad pierwszym zadaniem i w razie potrzeby poprosi Cię o wyjaśnienia lub uprawnienia.
Kontekst trybu agenta
Kontekst umożliwia agentowi generowanie lepszych odpowiedzi na dany prompt. Kontekst może pochodzić z plików w IDE, plików w folderach lokalnego systemu, odpowiedzi narzędzia i szczegółów prompta.
W zależności od środowiska IDE i ustawień agent może mieć dostęp do różnych kontekstów.
Na kartach poniżej znajdziesz szczegółowe informacje o tym, jak kontekst jest zbierany w różnych środowiskach IDE.
VS Code
W trybie agenta Gemini Code Assist ma zwykle dostęp do tych metod uzyskiwania kontekstu:
- Informacje w obszarze roboczym IDE.
- Odpowiedzi narzędzi wbudowanych, takich jak grep, terminal, odczyt pliku lub zapis pliku.
- odpowiedzi z wyszukiwarki Google,
- Treści z określonego adresu URL podane w prompcie lub przez narzędzie.
- pliki kontekstowe utworzone w Markdownie;
Pamięć agenta
Tryb agenta Gemini Code Assist w VS Code korzysta z usługi wykrywania pamięci Gemini CLI, aby znajdować i wczytywać GEMINI.md
pliki, które zapewniają kontekst dla agenta. Usługa wykrywania pamięci przeszukuje te pliki hierarchicznie, zaczynając od bieżącego katalogu roboczego i przechodząc do katalogu głównego projektu oraz katalogu domowego. Wyszukuje też w podkatalogach.
Możesz tworzyć pliki kontekstowe na poziomie globalnym, projektu i komponentu, które są łączone, aby dostarczać modelowi najbardziej odpowiednie informacje.
Za pomocą polecenia /memory show
możesz wyświetlić połączoną zawartość wszystkich załadowanych plików GEMINI.md
, a za pomocą polecenia /memory refresh
– ponownie je załadować.
Rozszerzenia interfejsu wiersza poleceń Gemini
Za pomocą rozszerzeń interfejsu wiersza poleceń Gemini możesz konfigurować i rozszerzać funkcje trybu agenta Gemini Code Assist.
Agent szuka rozszerzeń w 2 lokalizacjach:
WORKSPACE/.gemini/extensions
, gdzieWORKSPACE
to Twój bieżący obszar roboczy.~/.gemini/extensions
, gdzie~
to Twój katalog domowy.
Agent wczytuje wszystkie rozszerzenia z obu lokalizacji, ale jeśli w obu lokalizacjach znajduje się rozszerzenie o tej samej nazwie, pierwszeństwo ma rozszerzenie w katalogu obszaru roboczego. Każde rozszerzenie to katalog zawierający plik gemini-extension.json
. Ten plik zawiera konfigurację rozszerzenia.
Więcej informacji znajdziesz w artykule Rozszerzenia interfejsu Gemini CLI.
IntelliJ
Ta funkcja nie jest obsługiwana w przypadku Gemini Code Assist w IntelliJ ani w innych środowiskach IDE JetBrains.
Narzędzia
Narzędzia to szeroka kategoria usług, których agent może używać w odpowiedzi na Twój prompt, aby uzyskać kontekst i wykonać działania. Przykładowe narzędzia to wbudowane narzędzia, takie jak grep oraz odczyt i zapis plików, lokalne lub zdalne serwery protokołu kontekstu modelu (MCP) i ich funkcje wykonywalne oraz niestandardowe implementacje usług.