एजेंट मोड के बारे में खास जानकारी

इस दस्तावेज़ में, Gemini Code Assist के एजेंट मोड के बारे में बताया गया है.

एजेंट मोड, VS Code और IntelliJ इंटिग्रेटेड डेवलपमेंट एनवायरमेंट (आईडीई) में उपलब्ध है. एजेंट मोड का इस्तेमाल करने के लिए, Gemini Code Assist के एजेंट मोड का इस्तेमाल करना लेख पढ़ें.

एजेंट मोड की मदद से, ये और अन्य काम किए जा सकते हैं:

  • अपने कोड के बारे में सवाल पूछना.
  • जनरेट किए गए कॉन्टेंट को बेहतर बनाने के लिए, कॉन्टेक्स्ट और पहले से मौजूद टूल का इस्तेमाल करना.
  • एजेंट की क्षमताओं को बढ़ाने के लिए, एमसीपी सर्वर कॉन्फ़िगर करना.
  • कई चरणों वाले मुश्किल टास्क के समाधान पाना.
  • डिज़ाइन से जुड़े दस्तावेज़ों, समस्याओं, और TODO टिप्पणियों से कोड जनरेट करना.
  • एक्ज़ीक्यूशन के दौरान, प्लान और टूल के इस्तेमाल पर टिप्पणी करके, उनमें बदलाव करके, और उन्हें मंज़ूरी देकर, एजेंट के व्यवहार को कंट्रोल करना.

एजेंट मोड कैसे काम करता है

एजेंट मोड में, आपका प्रॉम्प्ट Gemini API को भेजा जाता है. इसके साथ, उपलब्ध टूल की सूची भी भेजी जाती है. Gemini API, प्रॉम्प्ट को प्रोसेस करता है और जवाब देता है. जवाब, सीधे तौर पर दिया गया जवाब हो सकता है या उपलब्ध टूल का इस्तेमाल करने का अनुरोध हो सकता है.

जब किसी टूल का अनुरोध किया जाता है, तो एजेंट उस टूल का इस्तेमाल करने की तैयारी करता है. साथ ही, यह भी देखता है कि उसे साफ़ तौर पर अनुमति मिली है या नहीं. इसके अलावा, वह यह भी देखता है कि उसे बिना अनुमति के टूल का इस्तेमाल करने की अनुमति है या नहीं:

  • फ़ाइल सिस्टम में बदलाव करने या किसी भी संसाधन पर बदलाव करने वाली कार्रवाइयां करने के लिए, टूल के अनुरोधों के लिए, Gemini आपसे अनुमति मांगेगा. ऐसा तब तक होगा, जब तक आपने Gemini को एक या उससे ज़्यादा टूल के इस्तेमाल की अनुमति देने के लिए कॉन्फ़िगर नहीं किया होगा.
  • सिर्फ़ पढ़ने के लिए किए गए टूल के अनुरोधों के लिए, टास्क पूरा करने से पहले अनुमति न मांगी जाए.

किसी टूल का इस्तेमाल करने की अनुमति मांगे जाने पर, आपके पास अनुमति देने या अनुरोध अस्वीकार करने का विकल्प होता है. एजेंट, किसी टूल या सर्वर को हमेशा अनुमति देने या एक जैसी कार्रवाइयों की अनुमति देने के विकल्प भी दे सकता है. ज़्यादा जानकारी के लिए, एजेंट की कार्रवाइयों को हमेशा अनुमति देना लेख पढ़ें.

टूल का इस्तेमाल करने की अनुमति मिलने या खुद से अनुमति देने के बाद, एजेंट ज़रूरी कार्रवाई करने के लिए टूल का इस्तेमाल करता है. इसके बाद, कार्रवाई का नतीजा Gemini API को वापस भेज दिया जाता है. Gemini, टूल की कार्रवाई के नतीजे को प्रोसेस करता है और एक और जवाब जनरेट करता है. कार्रवाई और उसकी जांच तब तक बार-बार की जाती है, जब तक टास्क पूरा नहीं हो जाता.

मुश्किल टास्क के लिए, Gemini आपकी मंज़ूरी के लिए एक हाई-लेवल प्लान दिखा सकता है. प्रोसेस शुरू करने से पहले, प्लान को बेहतर बनाया जा सकता है और चैट में सवाल पूछे जा सकते हैं. प्लान से संतुष्ट होने के बाद, उसे मंज़ूरी दी जा सकती है. प्लान को मंज़ूरी देने के बाद, एजेंट पहले टास्क पर काम करना शुरू कर देता है. साथ ही, प्लान को पूरा करते समय, ज़रूरत के हिसाब से आपसे जानकारी या अनुमतियां मांगता है.

एजेंट मोड का कॉन्टेक्स्ट

कॉन्टेक्स्ट की मदद से, एजेंट किसी दिए गए प्रॉम्प्ट के लिए बेहतर जवाब जनरेट कर सकता है. कॉन्टेक्स्ट, आपके आईडीई में मौजूद फ़ाइलों, आपके लोकल सिस्टम फ़ोल्डर में मौजूद फ़ाइलों, टूल के जवाबों, और आपके प्रॉम्प्ट की जानकारी से लिया जा सकता है.

आपके आईडीई और सेटिंग के हिसाब से, एजेंट के लिए अलग-अलग कॉन्टेक्स्ट उपलब्ध हो सकते हैं.

यहां दिए गए टैब में, अलग-अलग आईडीई के लिए कॉन्टेक्स्ट इकट्ठा करने के तरीके के बारे में बताया गया है.

VS Code

आम तौर पर, एजेंट मोड में Gemini Code Assist के लिए, कॉन्टेक्स्ट पाने के ये तरीके उपलब्ध होते हैं:

  • आपके आईडीई के वर्कस्पेस में मौजूद जानकारी.
  • grep, टर्मिनल, फ़ाइल पढ़ना या फ़ाइल लिखना जैसे पहले से मौजूद टूल से मिले जवाब.
  • Google Search के जवाब.
  • प्रॉम्प्ट या टूल में दिए गए किसी यूआरएल से मिला कॉन्टेंट.
  • Markdown में बनाई गई कॉन्टेक्स्ट फ़ाइलें.

IntelliJ

आम तौर पर, एजेंट मोड में Gemini Code Assist के लिए, कॉन्टेक्स्ट पाने के ये तरीके उपलब्ध होते हैं:

  • आपके आईडीई प्रोजेक्ट में मौजूद जानकारी. इसमें आपकी फ़ाइलें, इंडेक्स किए गए सिंबल, और आपके प्रोजेक्ट में सिंबल का इस्तेमाल शामिल है.
  • grep, फ़ाइल पढ़ना या फ़ाइल लिखना जैसे पहले से मौजूद टूल से मिले जवाब.
  • IntelliJ वर्शन कंट्रोल.
  • कॉन्फ़िगर किए गए एमसीपी सर्वर और टूल
  • Markdown में बनाई गई कॉन्टेक्स्ट फ़ाइलें.

एजेंट मोड के चैट प्रॉम्प्ट वाले सेक्शन में, कॉन्टेक्स्ट ड्रॉअर में एजेंट के लिए उपलब्ध कॉन्टेक्स्ट देखा जा सकता है.

एजेंट मोड का कॉन्टेक्स्ट ड्रॉअर.

टूल

टूल, सेवाओं की एक बड़ी कैटगरी है. एजेंट, आपके प्रॉम्प्ट के जवाब में कॉन्टेक्स्ट और कार्रवाइयों के लिए इनका इस्तेमाल कर सकता है. टूल की मदद से, एजेंट एपीआई एंडपॉइंट या अन्य एजेंट को फ़ंक्शन कॉल करके, अप-टू-डेट जानकारी ऐक्सेस कर सकते हैं. ऐसा हो सकता है कि टूल सिर्फ़ एक फ़ंक्शन ऑफ़र करें या एक से ज़्यादा मिलते-जुलते फ़ंक्शन ऑफ़र करें.

कुछ उदाहरण के तौर पर, grep और फ़ाइल पढ़ना या लिखना जैसे पहले से मौजूद टूल, लोकल या रिमोट मॉडल कॉन्टेक्स्ट प्रोटोकॉल (एमसीपी) सर्वर और उनके एक्ज़ीक्यूटेबल फ़ंक्शन, और RESTful API कॉल शामिल हैं.

पहले से मौजूद टूल

एजेंट मोड में, Gemini के पास आपके सिस्टम के पहले से मौजूद टूल का ऐक्सेस होता है. एजेंट मोड में Gemini के लिए उपलब्ध पहले से मौजूद टूल की सूची देखने के लिए, अपना आईडीई चुनें.

VS Code

Gemini Code Assist के एजेंट मोड में, Gemini CLI के पहले से मौजूद सभी टूल उपलब्ध हैं.

IntelliJ

read_file
किसी फ़ाइल के ऐब्सलूट पाथ का इस्तेमाल करके, उसका टेक्स्ट कॉन्टेंट वापस लाता है.
write_file
दिए गए टेक्स्ट को किसी तय फ़ाइल में लिखता है. अगर फ़ाइल मौजूद नहीं है, तो उसे बनाता है.
analyze_current_file
एडिटर में खुली फ़ाइल में, गड़बड़ियों और चेतावनियों का विश्लेषण करता है.
find_files
फ़ाइल का नाम या पाथ का कोई हिस्सा दिए जाने पर, फ़ाइलों का ऐब्सलूट पाथ ढूंढता है
grep
प्रोजेक्ट में मौजूद उन सभी फ़ाइलों को ढूंढता है जिनमें दिया गया टेक्स्ट पैटर्न या रेगुलर एक्सप्रेशन शामिल होता है.
list_files
दिए गए ऐब्सलूट पाथ में मौजूद सभी फ़ाइलों और डायरेक्ट्री की सूची दिखाता है.
resolve_symbol
किसी खास सिंबल रेफ़रंस को उसकी ओरिजनल डेक्लेरेशन में बदलता है.
find_usages
प्रोजेक्ट में, किसी दिए गए सिंबल डेक्लेरेशन के सभी रेफ़रंस खोजता है.
git
Git कमांड-लाइन इंटरफ़ेस (सीएलआई) कमांड चलाता है और नतीजा दिखाता है.
list_vcs_roots
मौजूदा प्रोजेक्ट में, वर्शन कंट्रोल सिस्टम (वीसीएस) के सभी रूट दिखाता है. जैसे, Git रिपॉज़िटरी.

सीमाएं

ऐसा हो सकता है कि Gemini Code Assist की स्टैंडर्ड चैट की कुछ सुविधाएं, एजेंट मोड में उपलब्ध न हों. यह भी हो सकता है कि वे स्टैंडर्ड चैट में अलग तरीके से काम करें.

एजेंट मोड में, बोलकर जवाब देने की सुविधा उपलब्ध नहीं है. एजेंट मोड में, Gemini सोर्स का हवाला नहीं देता. साथ ही, आपके पास उन कोड सुझावों को बंद करने का विकल्प नहीं होता जो हवाला दिए गए सोर्स से मेल खाते हैं.

आगे क्या करना है