Używanie czatu z agentem jako programisty pracującego w parze

Ten dokument opisuje, jak skonfigurować i używać trybu agenta Gemini Code Assist jako programisty pracującego w parze w zintegrowanym środowisku programistycznym (IDE).

Tryb agenta jest dostępny w środowisku IDE VS Code.

W trybie agenta możesz m.in.:

  • zadawać pytania dotyczące kodu;
  • Używaj kontekstu i wbudowanych narzędzi, aby ulepszać wygenerowane treści.
  • Skonfiguruj serwery MCP, aby rozszerzyć możliwości agenta.
  • Uzyskuj rozwiązania złożonych zadań składających się z wielu etapów.
  • Generowanie kodu na podstawie dokumentów projektowych, zgłoszeń i TODO komentarzy.
  • Kontroluj działanie agenta, komentując, edytując i zatwierdzając plany oraz korzystanie z narzędzi podczas wykonywania zadań.

Ograniczenia

Podczas korzystania z trybu agenta obowiązują te ograniczenia:

  • Agent nie może wywoływać narzędzi Gemini Code Assist. Aby korzystać z tych narzędzi, musisz wyjść z trybu agenta.
  • Agent nie może używać dostosowywania kodu. Aby używać dostosowywania kodu, musisz wyjść z trybu agenta.
  • Projekty z wieloma katalogami głównymi nie są obsługiwane w trybie agenta. Jeśli używasz trybu agenta w projekcie z wieloma katalogami głównymi, agent ma dostęp tylko do pierwszego katalogu głównego, który napotka.
  • Dzienniki Gemini w Google Cloud nie są obsługiwane w trybie agenta.

Zanim zaczniesz

  1. Skonfiguruj wersję Gemini Code Assist, której chcesz używać w IDE:
  2. Ustaw kanał wersji Gemini Code Assist na wersję Insiders:
    1. Otwórz paletę poleceń (Cmd + Shift + P), a następnie wybierz Open User Settings JSON (Otwórz plik JSON ustawień użytkownika).
    2. Dodaj ten wiersz do pliku JSON ustawień użytkownika:
      "geminicodeassist.updateChannel": "Insiders",

Korzystanie z trybu agenta

W trybie agenta możesz poprosić Gemini o realizację celów na wysokim poziomie i wykonywanie złożonych zadań.

Aby w pełni wykorzystać możliwości trybu agenta, stosuj sprawdzone metody tworzenia promptów i podawaj jak najwięcej szczegółów.

Aby przełączyć się na tryb agenta:

VS Code

  1. Aby otworzyć czat Gemini Code Assist, na pasku działań IDE kliknij spark Gemini Code Assist.
  2. Kliknij przełącznik Agent, aby przejść do trybu agenta. Przełącznik jest wyróżniony, gdy jest włączony tryb agenta, a szary, gdy jest włączony zwykły czat.
  3. Wpisz prompta na czacie Gemini Code Assist.

Gemini odpowiada na Twój prompt lub prosi o pozwolenie na użycie narzędzia.

Aby zatrzymać agenta, kliknij Zatrzymaj.

Aby użyć standardowego czatu Gemini Code Assist, kliknij Nowy czat, aby utworzyć nowy czat.

Tryb agenta Gemini Code Assist jest obsługiwany przez interfejs wiersza poleceń Gemini.

IntelliJ

Ta funkcja nie jest obsługiwana w przypadku Gemini Code Assist w IntelliJ ani w innych środowiskach IDE JetBrains.

Konfigurowanie narzędzi w trybie agenta

Narzędzia to szeroka kategoria usług, których agent może używać w odpowiedzi na Twój prompt, aby uzyskać kontekst i wykonać działania. Przykładowe narzędzia to wbudowane narzędzia, takie jak grep oraz odczyt i zapis plików, lokalne lub zdalne serwery protokołu kontekstu modelu (MCP) i ich funkcje wykonywalne lub niestandardowe implementacje usług.

Konfigurowanie serwerów MCP

Aby określić, które serwery są dostępne w trybie agenta, dodaj je do pliku JSON ustawień Gemini zgodnie z dokumentacją serwera.

VS Code

  1. Zainstaluj wszystkie zależności wymagane przez serwer MCP.
  2. Otwórz plik JSON z ustawieniami Gemini, który znajduje się w katalogu ~/.gemini/settings.json, gdzie ~ to Twój katalog domowy.
  3. Dodaj lokalne lub zdalne serwery MCP do pliku JSON ustawień Gemini zgodnie z instrukcjami serwera.

    W tym przykładzie dodajemy zdalny serwer Cloudflare MCP i instalujemy serwery GitHub i GitLab na komputerze lokalnym.

    {
        "mcpServers": {
        "github": {
          "command": "npx",
          "args": [
            "-y",
            "@modelcontextprotocol/server-github"
          ],
          "env": {
            "GITHUB_PERSONAL_ACCESS_TOKEN": "ghp_example_personal_access_token12345"
          }
        },
        "gitlab": {
          "command": "npx",
          "args": [
              "-y",
              "@modelcontextprotocol/server-gitlab"
          ]
        },
            "cloudflare-observability": {
                "command": "npx",
                "args": ["mcp-remote", "https://observability.mcp.cloudflare.com/sse"]
            },
            "cloudflare-bindings": {
                "command": "npx",
                "args": ["mcp-remote", "https://bindings.mcp.cloudflare.com/sse"]
            }
        }
    }
    

  4. Otwórz paletę poleceń i kliknij Developer: Reload Window (Deweloper: ponownie załaduj okno).

Skonfigurowane serwery MCP są dostępne dla agenta w trybie agenta.

IntelliJ

Ta funkcja nie jest obsługiwana w przypadku Gemini Code Assist w IntelliJ ani w innych środowiskach IDE JetBrains.

Uwierzytelnianie serwera MCP

W przypadku serwerów MCP, które wymagają uwierzytelniania, możesz dodać je do pliku JSON ustawień Gemini.

Ten przykład dodaje osobisty token dostępu do GitHuba:

{
//other settings...

"github": {
  "command": "/Users/username/code/github-mcp-server/cmd/github-mcp-server/github-mcp-server",
  "args": ["stdio"],
  "env": {
    "GITHUB_PERSONAL_ACCESS_TOKEN": "ACCESS_TOKEN"
  }
},

// other settings...
}

gdzie ACCESS_TOKEN to token dostępu użytkownika.

Tworzenie pliku kontekstu

Kontekst umożliwia agentowi generowanie lepszych odpowiedzi na dany prompt. Kontekst może pochodzić z plików w IDE, plików w folderach lokalnego systemu, odpowiedzi narzędzia i szczegółów prompta. Więcej informacji znajdziesz w artykule Kontekst trybu agenta.

VS Code

  1. Utwórz plik o nazwie GEMINI.md w lokalizacji, która odpowiada zakresowi, w jakim ma być stosowany kontekst. W tabeli poniżej znajdziesz szczegółowe informacje o lokalizacjach plików kontekstu w przypadku różnych zakresów:

    Zakres Lokalizacja
    Wszystkie Twoje projekty ~/.gemini/GEMINI.md
    określonego projektu, Katalog roboczy lub dowolne katalogi nadrzędne aż do katalogu głównego projektu (oznaczonego folderem .git) lub katalogu domowego.
    Konkretny komponent, moduł lub podsekcja projektu. Podkatalogi katalogu roboczego.

    System pamięci agenta jest tworzony przez wczytywanie plików kontekstu z wielu lokalizacji. Kontekst z bardziej szczegółowych plików, np. plików dotyczących konkretnych komponentów lub modułów, zastępuje lub uzupełnia treść z bardziej ogólnych plików kontekstu, takich jak globalny plik kontekstu w ~/.gemini/GEMINI.md.

  2. Napisz w Markdownie wszystkie reguły, informacje z przewodnika po stylu lub kontekst, których ma używać agent, i zapisz plik. Więcej informacji znajdziesz w przykładowym pliku kontekstu na GitHubie.

IntelliJ

Ta funkcja nie jest obsługiwana w przypadku Gemini Code Assist w IntelliJ ani w innych środowiskach IDE JetBrains.

Używanie poleceń

Polecenia po ukośniku / umożliwiają szybkie uruchamianie poleceń podobnych do tych w oknie terminala.

W trybie agenta możesz używać tych poleceń interfejsu Gemini CLI:

  • /tools: wyświetla listę narzędzi dostępnych w sesji trybu agenta. Obejmują one te podpolecenia:
    • desc lub descriptions: wyświetla szczegółowe opisy poszczególnych narzędzi.
    • nodesc lub nodescriptions: ukrywa opisy narzędzi i wyświetla tylko ich nazwy.
  • /memory: zarządza kontekstem instrukcyjnym agenta załadowanym z plików GEMINI.md. Obejmują one te podpolecenia:
    • show: Wyświetla pełną, połączoną zawartość bieżącej pamięci załadowanej ze wszystkich dostępnych plików GEMINI.md.
    • refresh: ponownie wczytuje pamięć ze wszystkich plików GEMINI.md w dostępnych lokalizacjach. Informacje o tym, jak pliki GEMINI.md wpływają na pamięć hierarchiczną agenta, znajdziesz w dokumentacji konfiguracji interfejsu wiersza poleceń Gemini.
  • /mcp: wyświetla skonfigurowane serwery MCP (Model Context Protocol), ich stan połączenia, szczegóły serwera i dostępne narzędzia. Obejmują one te podpolecenia:
    • desc lub descriptions: wyświetla szczegółowe opisy serwerów i narzędzi MCP.
    • nodesc lub nodescriptions: ukrywa opisy serwerów MCP i wyświetla tylko ich nazwy.
    • schema: wyświetla pełny schemat JSON skonfigurowanych parametrów serwera MCP.
  • /stats: wyświetla szczegółowe statystyki sesji w trybie agenta i czas trwania.

Więcej informacji o poleceniach interfejsu Gemini znajdziesz w artykule Polecenia interfejsu Gemini. Pamiętaj, że nie wszystkie polecenia interfejsu Gemini CLI są dostępne w trybie agenta.

Zawsze zezwalaj na działania agenta

Możesz automatycznie zezwalać na wszystkie działania agenta.

Aby automatycznie zezwalać na wszystkie działania agenta:

  1. Otwórz plik JSON z ustawieniami użytkownika VS Code:

    1. Otwórz paletę poleceń (ctrl/command + Shift + P).
    2. Wybierz Ustawienia: otwórz ustawienia użytkownika (JSON).
  2. Dodaj do pliku JSON ustawień użytkownika VS Code ten kod:

    //other settings...
    
    "geminicodeassist.agentYoloMode": "true",
    //other settings...
    
  3. Otwórz paletę poleceń i kliknij Developer: Reload Window (Deweloper: ponownie załaduj okno).

Tryb agenta korzysta z trybu yolo i nie prosi o zezwolenie przed podjęciem działań, gdy wyślesz mu prompt.

Tworzenie rozszerzeń interfejsu Gemini CLI

Za pomocą rozszerzeń interfejsu wiersza poleceń Gemini możesz konfigurować i rozszerzać funkcje trybu agenta Gemini Code Assist.

Agent szuka rozszerzeń w 2 lokalizacjach:

  • WORKSPACE/.gemini/extensions, gdzie WORKSPACE to Twój bieżący obszar roboczy.
  • ~/.gemini/extensions, gdzie ~ to Twój katalog domowy.

Agent wczytuje wszystkie rozszerzenia z obu lokalizacji, ale jeśli w obu występuje rozszerzenie o tej samej nazwie, pierwszeństwo ma rozszerzenie w katalogu obszaru roboczego. Każde rozszerzenie to katalog zawierający plik gemini-extension.json. Ten plik zawiera konfigurację rozszerzenia.

Więcej informacji znajdziesz w artykule Rozszerzenia interfejsu wiersza poleceń Gemini.

Dodatkowe prompty

Wypróbuj te prompty, podając własne informacje:

  • „Do czego służy to repozytorium? Wyjaśnij mi architekturę”.
  • „Do czego służy ta [klasa/funkcja]?”
  • „Dodaj funkcję do tej bazy kodu – „[link-or-path-to-codebase]”.
  • „Przebuduj funkcje [A] i [B], aby korzystały ze wspólnej metody [C]”.
  • „Rozwiąż problem na GitHubie [link-to-github-issue]”.
  • „Utwórz aplikację, która będzie realizować [cel], z interfejsem użytkownika, który umożliwi użytkownikowi wykonanie [zadania] w [środowisku]”.
  • „Przenieś wersje biblioteki w tym repozytorium z [X] na [Y]”.
  • „Zoptymalizuj wydajność tego kodu Go, aby działał szybciej”.
  • „Użyj [name-of-API], aby rozwinąć tę funkcję”.
  • „Wdróż algorytm, który będzie wykonywać [x], [Y] i [Z]”.

Co dalej?