โหมดตัวแทน

เอกสารนี้อธิบายโหมดตัวแทนใน Gemini Code Assist

โหมดเอเจนต์พร้อมใช้งานในสภาพแวดล้อมในการพัฒนาซอฟต์แวร์แบบรวม (IDE) ของ VS Code หากต้องการเริ่มใช้โหมดตัวแทน โปรดดูใช้แชทแบบตัวแทนเป็นโปรแกรมเมอร์คู่

โหมด Agent ใน VS Code ทำงานโดย Gemini CLI

เมื่อใช้โหมดตัวแทน คุณจะทำสิ่งต่อไปนี้และอื่นๆ ได้

  • ถามคำถามเกี่ยวกับโค้ด
  • ใช้บริบทและเครื่องมือในตัวเพื่อปรับปรุงเนื้อหาที่สร้างขึ้น
  • กำหนดค่าเซิร์ฟเวอร์ MCP เพื่อขยายความสามารถของเอเจนต์
  • รับวิธีแก้ปัญหาสำหรับงานที่ซับซ้อนซึ่งมีหลายขั้นตอน
  • สร้างโค้ดจากเอกสารการออกแบบ ปัญหา และTODOความคิดเห็น
  • ควบคุมลักษณะการทำงานของเอเจนต์โดยการแสดงความคิดเห็น แก้ไข และอนุมัติแผน และการใช้เครื่องมือในระหว่างการดำเนินการ

วิธีการทำงานของโหมดตัวแทน

ในโหมดตัวแทน ระบบจะส่งพรอมต์ของคุณไปยัง Gemini API พร้อมกับรายการเครื่องมือที่พร้อมใช้งาน Gemini API จะประมวลผลพรอมต์และแสดงคำตอบ คำตอบอาจเป็นคำตอบโดยตรงหรือคำขอให้ใช้เครื่องมือที่มีอยู่

เมื่อมีการขอใช้เครื่องมือ เจ้าหน้าที่จะเตรียมใช้เครื่องมือและตรวจสอบว่า ได้รับอนุญาตให้ใช้เครื่องมือโดยมีหรือไม่มีสิทธิ์ที่ชัดเจนหรือไม่

  • สำหรับคำขอเครื่องมือที่แก้ไขระบบไฟล์หรือดำเนินการเปลี่ยนแปลง ในทรัพยากรใดๆ Gemini จะขอให้คุณอนุญาตการดำเนินการ เว้นแต่คุณจะกำหนดค่า Gemini ให้อนุญาตเครื่องมือ หรือเครื่องมือต่างๆ เสมอ
  • คำขอเครื่องมือที่เป็นแบบอ่านอย่างเดียวอาจไม่ขอสิทธิ์ก่อนที่จะทำงานให้เสร็จ

เมื่อระบบขออนุญาตให้ใช้เครื่องมือ คุณสามารถเลือกอนุญาตหรือปฏิเสธ การดำเนินการได้ นอกจากนี้ ตัวแทนยังอาจให้ตัวเลือกในการอนุญาตเครื่องมือหรือเซิร์ฟเวอร์เสมอ หรืออนุญาตการดำเนินการที่คล้ายกัน ดูข้อมูลเพิ่มเติมได้ที่ อนุญาตการดำเนินการของเอเจนต์เสมอ

เมื่อได้รับสิทธิ์ให้ใช้เครื่องมือหรือให้สิทธิ์ด้วยตนเองแล้ว เจ้าหน้าที่จะใช้เครื่องมือ เพื่อดำเนินการที่จำเป็นให้เสร็จสมบูรณ์ และระบบจะส่งผลลัพธ์ของการดำเนินการนั้น กลับไปยัง Gemini API Gemini จะประมวลผลผลลัพธ์ของการ ดำเนินการด้วยเครื่องมือและสร้างคำตอบอื่น วงจรการดำเนินการและการประเมินนี้จะดำเนินต่อไปจนกว่างานจะเสร็จสมบูรณ์

สำหรับงานที่ซับซ้อน Gemini อาจแสดงแผนระดับสูงเพื่อให้คุณอนุมัติ คุณสามารถปรับแผนและถามคำถามในแชทก่อนเริ่มกระบวนการได้ เมื่อพอใจกับแผนแล้ว คุณก็อนุมัติได้ หลังจากที่คุณอนุมัติแผนแล้ว ตัวแทนจะเริ่มทำงานแรก และจะขอคำชี้แจงหรือสิทธิ์จากคุณตามที่จำเป็นขณะดำเนินการตามแผน

บริบทของโหมดตัวแทน

บริบทช่วยให้ตัวแทนสร้างคำตอบที่ดีขึ้นสำหรับพรอมต์ที่ระบุ บริบท สามารถนำมาจากไฟล์ใน IDE, ไฟล์ในโฟลเดอร์ระบบในเครื่อง, คำตอบของเครื่องมือ และรายละเอียดพรอมต์

บริบทต่างๆ อาจพร้อมใช้งานสำหรับเอเจนต์ ทั้งนี้ขึ้นอยู่กับ IDE และการตั้งค่า

แท็บต่อไปนี้จะแสดงรายละเอียดวิธีรวบรวมบริบทสำหรับ IDE ต่างๆ

VS Code

โดยปกติแล้ว Gemini Code Assist ในโหมดเอเจนต์จะมีวิธีการรับบริบทต่อไปนี้

  • ข้อมูลในพื้นที่ทำงานของ IDE
  • คำตอบของเครื่องมือจากเครื่องมือในตัว เช่น grep, เทอร์มินัล, การอ่านไฟล์ หรือ การเขียนไฟล์
  • คำตอบของ Google Search
  • เนื้อหาจาก URL ที่ระบุในพรอมต์หรือโดยเครื่องมือ
  • ไฟล์บริบทที่คุณสร้างในมาร์กดาวน์

หน่วยความจำของตัวแทน

โหมด Agent ของ Gemini Code Assist ใน VS Code ใช้ประโยชน์จาก บริการค้นหาหน่วยความจำของ Gemini CLI เพื่อค้นหาและโหลดGEMINI.md ไฟล์ที่ให้บริบทแก่ Agent บริการค้นหาความทรงจำ จะค้นหาไฟล์เหล่านี้ตามลำดับชั้น โดยเริ่มจากไดเรกทอรีการทำงานปัจจุบัน และย้ายขึ้นไปยังรูทของโปรเจ็กต์และไดเรกทอรีบ้าน นอกจากนี้ ยัง ค้นหาในไดเรกทอรีย่อยด้วย

คุณสร้างไฟล์บริบทได้ในระดับส่วนกลาง ระดับโปรเจ็กต์ และระดับคอมโพเนนต์ ซึ่งจะรวมกันเพื่อให้ โมเดลได้รับข้อมูลที่เกี่ยวข้องมากที่สุด

คุณใช้คำสั่ง /memory show เพื่อดูเนื้อหาที่รวมกันของไฟล์ GEMINI.md ที่โหลดทั้งหมด และใช้คำสั่ง /memory refresh เพื่อโหลดไฟล์เหล่านั้นซ้ำได้

ส่วนขยาย Gemini CLI

คุณสามารถใช้ส่วนขยาย Gemini CLI เพื่อกำหนดค่าและขยาย ฟังก์ชันการทำงานของโหมดตัวแทน Gemini Code Assist ได้

เอเจนต์จะมองหาส่วนขยายใน 2 ที่ต่อไปนี้

  • WORKSPACE/.gemini/extensions โดยที่ WORKSPACE คือพื้นที่ทำงานปัจจุบันของคุณ
  • ~/.gemini/extensions โดยที่ ~ คือไดเรกทอรีหลัก

เอเจนต์จะโหลดส่วนขยายทั้งหมดจากทั้ง 2 ตำแหน่ง แต่หากมีส่วนขยายที่มีชื่อเดียวกันอยู่ในทั้ง 2 ตำแหน่ง ส่วนขยายในไดเรกทอรีพื้นที่ทำงานจะมีความสำคัญมากกว่า ส่วนขยายแต่ละรายการคือไดเรกทอรีที่มีไฟล์ gemini-extension.json ไฟล์นี้มีการกำหนดค่าสำหรับส่วนขยาย

ดูข้อมูลเพิ่มเติมได้ที่ ส่วนขยาย CLI ของ Gemini

IntelliJ

Gemini Code Assist สำหรับ IntelliJ หรือ IDE อื่นๆ ของ JetBrains ไม่รองรับฟีเจอร์นี้

เครื่องมือ

เครื่องมือเป็นหมวดหมู่บริการที่กว้างซึ่งเอเจนต์ใช้สำหรับบริบทและการดำเนินการในการตอบกลับพรอมต์ของคุณได้ ตัวอย่างเครื่องมือบางอย่าง ได้แก่ เครื่องมือในตัว เช่น grep และการอ่านหรือเขียนไฟล์, เซิร์ฟเวอร์ Model Context Protocol (MCP) ในเครื่องหรือจากระยะไกลและฟังก์ชันที่เรียกใช้งานได้ รวมถึงการติดตั้งใช้งานบริการที่กำหนดเอง

ขั้นตอนถัดไป