इस पेज पर, एजेंटिक के ग्लॉसरी शब्द शामिल हैं. सभी शब्दावली के लिए, यहां क्लिक करें.
A
कार्रवाई
एजेंटिक लूप में एक ऐसा चरण जिसमें एजेंट, वजह चरण के दौरान चुनी गई कार्रवाई को पूरा करता है. उदाहरण के लिए, ऐक्ट स्टेज कोई एपीआई अनुरोध भेज सकता है.
ऐक्शन गेम
रीइन्फ़ोर्समेंट लर्निंग में, एजेंट के एनवायरमेंट की स्टेट के बीच ट्रांज़िशन करने का तरीका. एजेंट, नीति का इस्तेमाल करके कार्रवाई चुनता है.
ऐक्शन स्पेस
संसाधनों का वह सेट जिसका इस्तेमाल करके एजेंट कोई टास्क पूरा कर सकता है. कार्रवाई करने की जगह में ऐसे टूल और एपीआई शामिल हो सकते हैं जिन्हें एजेंट इस्तेमाल कर सकता है. साथ ही, इसमें एजेंट के पास मौजूद अनुमतियां भी शामिल हो सकती हैं. आम तौर पर, ऐक्शन स्पेस इतना बड़ा होना चाहिए कि एजेंट टास्क पूरा कर सके. अगर ऐक्शन स्पेस बहुत छोटा है, तो हो सकता है कि एजेंट के पास टास्क पूरा करने के लिए ज़रूरी संसाधन न हों. अगर ऐक्शन स्पेस बहुत बड़ा है, तो एजेंट से ज़्यादा गड़बड़ियां होने की संभावना होती है.
एजेंट
ऐसा सॉफ़्टवेयर जो उपयोगकर्ता के इनपुट को क्रम से लगा सकता है, ताकि उपयोगकर्ता की ओर से कार्रवाइयां प्लान और लागू की जा सकें.
रीइन्फ़ोर्समेंट लर्निंग में, एजेंट वह इकाई होती है जो नीति का इस्तेमाल करके, एनवायरमेंट की स्टेट के बीच ट्रांज़िशन से मिलने वाले अनुमानित रिटर्न को ज़्यादा से ज़्यादा करती है.
एजेंटिक
यह agent का विशेषण फ़ॉर्म है. एजेंटिक का मतलब उन क्वालिटी से है जो एजेंट के पास होती हैं. जैसे, स्वायत्तता.
एजेंटिक लूप
यह एक ऐसा साइकल होता है जिसमें एजेंट तब तक दोहराता रहता है, जब तक टर्मिनेशन की शर्त पूरी नहीं हो जाती. इस साइकल में आम तौर पर ये चार चरण होते हैं:
एजेंटिक वर्कफ़्लो
यह एक डाइनैमिक प्रोसेस है. इसमें एजेंट, किसी लक्ष्य को हासिल करने के लिए अपने-आप प्लान बनाता है और कार्रवाइयाँ करता है. इस प्रोसेस में, वजह बताना, बाहरी टूल इस्तेमाल करना, और अपने प्लान को खुद ठीक करना शामिल हो सकता है.
एजेंट ऑर्केस्ट्रेशन
एक से ज़्यादा उप-एजेंट या एलएलएम कॉल के बीच, टास्क को मैनेज और रूट करने की सुविधा. एजेंट ऑर्केस्ट्रेशन की सुविधा, मुश्किल टास्क को छोटे-छोटे सब-टास्क में बाँट देती है. इसके बाद, इन सब-टास्क को सबसे काबिल सब-एजेंट को असाइन कर देती है.
ऑटोनॉमस एजेंट
यह एक ऐसा एजेंट है जो मुश्किल लक्ष्य को हासिल करने के लिए काम करता है. इसके लिए, वह प्लान बनाता है, काम करता है, और लगातार इंसानी दखल के बिना खुद को ढालता है.
E
आकलन करने वाला एजेंट
ऐसा एजेंट जो किसी दूसरे एजेंट के नतीजों का आकलन करता है. ऐसा तब किया जाता है, जब तक उन नतीजों को फ़ाइनल नहीं किया जाता. एक एजेंट को प्रॉडक्ट बनाने वाले एजेंट के तौर पर देखा जा सकता है. वहीं, दूसरे एजेंट को आकलन करने वाले एजेंट के तौर पर देखा जा सकता है. यह एजेंट, प्रॉडक्ट को रिलीज़ करने से पहले उसकी जांच करता है.
आलोचक, आकलन करने वाले एजेंट का दूसरा नाम है.
F
सुझाव/शिकायत/राय
यह एजेंटिक लूप का एक चरण है. इसमें एजेंट, कार्रवाई चरण के दौरान की गई कार्रवाई का आकलन करता है. उदाहरण के लिए, अगर एजेंट ने ऐक्ट स्टेज के दौरान एपीआई का अनुरोध भेजा है, तो फ़ीडबैक स्टेज यह तय कर सकता है कि एपीआई का जवाब सही था या नहीं.
G
Gemini के मॉडल
Google के नए और बेहतरीन ट्रांसफ़ॉर्मर पर आधारित मल्टीमॉडल. Gemini मॉडल को खास तौर पर एजेंट के साथ इंटिग्रेट करने के लिए डिज़ाइन किया गया है.
उपयोगकर्ता, Gemini मॉडल के साथ कई तरह से इंटरैक्ट कर सकते हैं. जैसे, इंटरैक्टिव डायलॉग इंटरफ़ेस और एसडीके के ज़रिए.
जनरेटिव एजेंट (सिमुलैकरा)
ऐसे एजेंट जिनमें खास पर्सोना, यादें, और रूटीन शामिल होते हैं. ये इंसानों की तरह व्यवहार करते हैं.
ज़्यादा जानकारी के लिए, जनरेटिव एजेंट: इंसानी व्यवहार का इंटरैक्टिव सिमुलेक्रा लेख पढ़ें.
M
मैनेजर एजेंट
ऐसा एजेंट जो एक या उससे ज़्यादा सब-एजेंट को कंट्रोल करता है.
मल्टी-एजेंट कोलाबोरेशन
एक ऐसा फ़्रेमवर्क जिसमें कई खास एआई एजेंट, किसी मुश्किल समस्या को हल करने के लिए एक-दूसरे से इंटरैक्ट करते हैं, बहस करते हैं या एक-दूसरे को टास्क पास करते हैं.
O
निगरानी करना
यह एजेंटिक लूप का एक चरण है. इसमें एजेंट, एजेंट की प्रोग्रेस के किसी पहलू की जांच करता है या उसका आकलन करता है. उदाहरण के लिए, मान लें कि act स्टेज से कुछ कोड जनरेट होता है. इसलिए, निरीक्षण करें चरण में, जनरेट किए गए कोड की जांच की जा सकती है.
P
प्लान बनाना और समस्या हल करना
यह एक एजेंटिक रणनीति है. इसमें मॉडल, कोई भी कार्रवाई करने से पहले, साफ़ तौर पर कई चरणों वाला प्लान तैयार करता है.
प्लगिन
यह एक स्टैंडर्ड और मॉड्यूलर टूल है. इसे एजेंट से आसानी से जोड़ा जा सकता है, ताकि उसकी क्षमताओं को बढ़ाया जा सके. उदाहरण के लिए, GitHub प्लगिन की मदद से एजेंट, GitHub से जुड़ी समस्याएं पढ़ सकते हैं और पुल के अनुरोध बना सकते हैं.
प्रोसीजरल मेमोरी
एजेंट में, किसी काम को करने का तरीका. उदाहरण के लिए, कोई एजेंट वेब पर खोज करने का तरीका याद रख सकता है. इसके बाद, वह खोज के सबसे ऊपर दिखने वाली तीन साइटें दिखा सकता है.
R
वजह
यह एजेंटिक लूप का एक चरण है. इसमें एजेंट यह तय करता है कि उसे क्या करना है. उदाहरण के लिए, एजेंट यह तय कर सकता है कि किसी खास एपीआई का अनुरोध भेजा जाना चाहिए.
गंभीर
यह एजेंटिक वर्कफ़्लो की क्वालिटी को बेहतर बनाने की एक रणनीति है. इसमें किसी चरण के आउटपुट की जांच की जाती है. इसके बाद, उस आउटपुट को अगले चरण में भेजा जाता है.
जवाब की जांच करने वाला LLM अक्सर वही होता है जिसने जवाब जनरेट किया है. हालांकि, यह कोई दूसरा एलएलएम भी हो सकता है. जवाब जनरेट करने वाला एलएलएम, अपने जवाब का सही आकलन कैसे कर सकता है? "ट्रिक" यह है कि एलएलएम को आलोचनात्मक (सोचने-समझने वाला) माइंडसेट में रखा जाए. यह प्रोसेस, किसी लेखक की प्रोसेस से मिलती-जुलती है. लेखक, पहला ड्राफ़्ट लिखते समय क्रिएटिव माइंडसेट का इस्तेमाल करता है. इसके बाद, उसे एडिट करते समय क्रिटिकल माइंडसेट का इस्तेमाल करता है.
उदाहरण के लिए, मान लें कि एक एजेंटिक वर्कफ़्लो है. इसका पहला चरण, कॉफ़ी मग के लिए टेक्स्ट बनाना है. इस चरण के लिए प्रॉम्प्ट यह हो सकता है:
मान लें कि आप एक क्रिएटिव हैं. कॉफ़ी मग के लिए, 50 से कम वर्णों वाला मज़ेदार और ओरिजनल टेक्स्ट जनरेट करो.
अब इस तरह के सवाल के बारे में सोचें:
मान लो कि तुम कॉफ़ी पीने वाले व्यक्ति हो. क्या आपको ऊपर दिया गया जवाब मज़ेदार लगा?
इसके बाद, वर्कफ़्लो सिर्फ़ ऐसे टेक्स्ट को अगले चरण में भेज सकता है जिसे रिफ़्लेक्शन स्कोर ज़्यादा मिला हो.
राउटर एजेंट
यह एजेंट, उपयोगकर्ता की क्वेरी को कैटगरी में बांटता है. इसके बाद, क्वेरी को हैंडल करने के लिए सबसे सही एजेंट को शुरू करता है.
S
खुद से सुधार करने की सुविधा
एजेंट की यह क्षमता होती है कि वह अपने आउटपुट में गड़बड़ी का पता लगा सके. इसके बाद, वह किसी दूसरे तरीके से काम कर सके.
राज्य
रीइन्फ़ोर्समेंट लर्निंग में, पैरामीटर की वे वैल्यू जो एनवायरमेंट के मौजूदा कॉन्फ़िगरेशन के बारे में बताती हैं. एजेंट इनका इस्तेमाल करके, कार्रवाई चुनता है.
स्टेट मशीन एजेंट
ऐसा एजेंट जिसके वर्कफ़्लो पर सख्त नियमों का पालन करने की पाबंदी है. आम तौर पर, स्टेट मशीन एजेंट, ऑटोनॉमस एजेंट की तुलना में कम गलतियां करते हैं. हालांकि, ये अपनी सीमाओं से बाहर की स्थितियों के हिसाब से खुद को नहीं ढाल पाते.
सब एजेंट
यह एक खास मॉडल है, जो किसी बड़ी समस्या के किसी खास सबसेट को हल करने के लिए, मैनेजर एजेंट की मदद से शुरू किया जाता है. आम तौर पर, एजेंट की तुलना में सब-एजेंट के पास कार्रवाई करने के लिए कम विकल्प होते हैं.
T
खाता बंद करने की शर्त
एजेंटिक एआई में, पहले से तय किए गए ऐसे मानदंड जो एजेंट को जवाब जनरेट करने से रोकते हैं. उदाहरण के लिए, यहां खाता बंद करने की कुछ संभावित शर्तें दी गई हैं:
- एजेंट ने लक्ष्य पूरा कर लिया है.
- एजेंट अब किसी और संसाधन का इस्तेमाल नहीं कर सकता.
- human-in-the-loop को कोई समस्या मिली है.
रीइन्फ़ोर्समेंट लर्निंग में, वे शर्तें जो यह तय करती हैं कि एपिसोड कब खत्म होगा. जैसे, जब एजेंट किसी खास स्थिति में पहुंच जाता है या स्थिति में बदलाव की थ्रेशोल्ड संख्या से ज़्यादा हो जाता है. उदाहरण के लिए, टिक-टैक-टो (इसे नट्स ऐंड क्रॉस भी कहा जाता है) में, कोई एपिसोड तब खत्म होता है, जब कोई खिलाड़ी लगातार तीन स्पेस मार्क कर देता है या जब सभी स्पेस मार्क कर दिए जाते हैं.