मशीन लर्निंग की शब्दावली: एजेंटिक

इस पेज पर, एजेंटिक के ग्लॉसरी शब्द शामिल हैं. सभी शब्दावली के लिए, यहां क्लिक करें.

A

कार्रवाई

#agent

एजेंटिक लूप में एक ऐसा चरण जिसमें एजेंट, वजह चरण के दौरान चुनी गई कार्रवाई को पूरा करता है. उदाहरण के लिए, ऐक्ट स्टेज कोई एपीआई अनुरोध भेज सकता है.

ऐक्शन गेम

#agent

रीइन्फ़ोर्समेंट लर्निंग में, एजेंट के एनवायरमेंट की स्टेट के बीच ट्रांज़िशन करने का तरीका. एजेंट, नीति का इस्तेमाल करके कार्रवाई चुनता है.

ऐक्शन स्पेस

#agent

संसाधनों का वह सेट जिसका इस्तेमाल करके एजेंट कोई टास्क पूरा कर सकता है. कार्रवाई करने की जगह में ऐसे टूल और एपीआई शामिल हो सकते हैं जिन्हें एजेंट इस्तेमाल कर सकता है. साथ ही, इसमें एजेंट के पास मौजूद अनुमतियां भी शामिल हो सकती हैं. आम तौर पर, ऐक्शन स्पेस इतना बड़ा होना चाहिए कि एजेंट टास्क पूरा कर सके. अगर ऐक्शन स्पेस बहुत छोटा है, तो हो सकता है कि एजेंट के पास टास्क पूरा करने के लिए ज़रूरी संसाधन न हों. अगर ऐक्शन स्पेस बहुत बड़ा है, तो एजेंट से ज़्यादा गड़बड़ियां होने की संभावना होती है.

एजेंट

#generativeAI
#agent

ऐसा सॉफ़्टवेयर जो उपयोगकर्ता के इनपुट को क्रम से लगा सकता है, ताकि उपयोगकर्ता की ओर से कार्रवाइयां प्लान और लागू की जा सकें.

रीइन्फ़ोर्समेंट लर्निंग में, एजेंट वह इकाई होती है जो नीति का इस्तेमाल करके, एनवायरमेंट की स्टेट के बीच ट्रांज़िशन से मिलने वाले अनुमानित रिटर्न को ज़्यादा से ज़्यादा करती है.

एजेंटिक

#generativeAI
#agent

यह agent का विशेषण फ़ॉर्म है. एजेंटिक का मतलब उन क्वालिटी से है जो एजेंट के पास होती हैं. जैसे, स्वायत्तता.

एजेंटिक लूप

#agent

यह एक ऐसा साइकल होता है जिसमें एजेंट तब तक दोहराता रहता है, जब तक टर्मिनेशन की शर्त पूरी नहीं हो जाती. इस साइकल में आम तौर पर ये चार चरण होते हैं:

  1. निगरानी करें
  2. वजह
  3. कानून
  4. सुझाव, राय या शिकायत

एजेंटिक वर्कफ़्लो

#generativeAI
#agent

यह एक डाइनैमिक प्रोसेस है. इसमें एजेंट, किसी लक्ष्य को हासिल करने के लिए अपने-आप प्लान बनाता है और कार्रवाइयाँ करता है. इस प्रोसेस में, वजह बताना, बाहरी टूल इस्तेमाल करना, और अपने प्लान को खुद ठीक करना शामिल हो सकता है.

एजेंट ऑर्केस्ट्रेशन

#agent

एक से ज़्यादा उप-एजेंट या एलएलएम कॉल के बीच, टास्क को मैनेज और रूट करने की सुविधा. एजेंट ऑर्केस्ट्रेशन की सुविधा, मुश्किल टास्क को छोटे-छोटे सब-टास्क में बाँट देती है. इसके बाद, इन सब-टास्क को सबसे काबिल सब-एजेंट को असाइन कर देती है.

ऑटोनॉमस एजेंट

#agent

यह एक ऐसा एजेंट है जो मुश्किल लक्ष्य को हासिल करने के लिए काम करता है. इसके लिए, वह प्लान बनाता है, काम करता है, और लगातार इंसानी दखल के बिना खुद को ढालता है.

E

आकलन करने वाला एजेंट

#agent

ऐसा एजेंट जो किसी दूसरे एजेंट के नतीजों का आकलन करता है. ऐसा तब किया जाता है, जब तक उन नतीजों को फ़ाइनल नहीं किया जाता. एक एजेंट को प्रॉडक्ट बनाने वाले एजेंट के तौर पर देखा जा सकता है. वहीं, दूसरे एजेंट को आकलन करने वाले एजेंट के तौर पर देखा जा सकता है. यह एजेंट, प्रॉडक्ट को रिलीज़ करने से पहले उसकी जांच करता है.

आलोचक, आकलन करने वाले एजेंट का दूसरा नाम है.

F

सुझाव/शिकायत/राय

#agent

यह एजेंटिक लूप का एक चरण है. इसमें एजेंट, कार्रवाई चरण के दौरान की गई कार्रवाई का आकलन करता है. उदाहरण के लिए, अगर एजेंट ने ऐक्ट स्टेज के दौरान एपीआई का अनुरोध भेजा है, तो फ़ीडबैक स्टेज यह तय कर सकता है कि एपीआई का जवाब सही था या नहीं.

G

Gemini के मॉडल

#generativeAI
#agent

Google के नए और बेहतरीन ट्रांसफ़ॉर्मर पर आधारित मल्टीमॉडल. Gemini मॉडल को खास तौर पर एजेंट के साथ इंटिग्रेट करने के लिए डिज़ाइन किया गया है.

उपयोगकर्ता, Gemini मॉडल के साथ कई तरह से इंटरैक्ट कर सकते हैं. जैसे, इंटरैक्टिव डायलॉग इंटरफ़ेस और एसडीके के ज़रिए.

जनरेटिव एजेंट (सिमुलैकरा)

#agent

ऐसे एजेंट जिनमें खास पर्सोना, यादें, और रूटीन शामिल होते हैं. ये इंसानों की तरह व्यवहार करते हैं.

ज़्यादा जानकारी के लिए, जनरेटिव एजेंट: इंसानी व्यवहार का इंटरैक्टिव सिमुलेक्रा लेख पढ़ें.

M

मैनेजर एजेंट

#agent

ऐसा एजेंट जो एक या उससे ज़्यादा सब-एजेंट को कंट्रोल करता है.

मल्टी-एजेंट कोलाबोरेशन

#agent

एक ऐसा फ़्रेमवर्क जिसमें कई खास एआई एजेंट, किसी मुश्किल समस्या को हल करने के लिए एक-दूसरे से इंटरैक्ट करते हैं, बहस करते हैं या एक-दूसरे को टास्क पास करते हैं.

O

निगरानी करना

#agent

यह एजेंटिक लूप का एक चरण है. इसमें एजेंट, एजेंट की प्रोग्रेस के किसी पहलू की जांच करता है या उसका आकलन करता है. उदाहरण के लिए, मान लें कि act स्टेज से कुछ कोड जनरेट होता है. इसलिए, निरीक्षण करें चरण में, जनरेट किए गए कोड की जांच की जा सकती है.

P

प्लान बनाना और समस्या हल करना

#agent

यह एक एजेंटिक रणनीति है. इसमें मॉडल, कोई भी कार्रवाई करने से पहले, साफ़ तौर पर कई चरणों वाला प्लान तैयार करता है.

प्लगिन

#agent

यह एक स्टैंडर्ड और मॉड्यूलर टूल है. इसे एजेंट से आसानी से जोड़ा जा सकता है, ताकि उसकी क्षमताओं को बढ़ाया जा सके. उदाहरण के लिए, GitHub प्लगिन की मदद से एजेंट, GitHub से जुड़ी समस्याएं पढ़ सकते हैं और पुल के अनुरोध बना सकते हैं.

प्रोसीजरल मेमोरी

#agent

एजेंट में, किसी काम को करने का तरीका. उदाहरण के लिए, कोई एजेंट वेब पर खोज करने का तरीका याद रख सकता है. इसके बाद, वह खोज के सबसे ऊपर दिखने वाली तीन साइटें दिखा सकता है.

R

वजह

#agent

यह एजेंटिक लूप का एक चरण है. इसमें एजेंट यह तय करता है कि उसे क्या करना है. उदाहरण के लिए, एजेंट यह तय कर सकता है कि किसी खास एपीआई का अनुरोध भेजा जाना चाहिए.

गंभीर

#generativeAI
#agent

यह एजेंटिक वर्कफ़्लो की क्वालिटी को बेहतर बनाने की एक रणनीति है. इसमें किसी चरण के आउटपुट की जांच की जाती है. इसके बाद, उस आउटपुट को अगले चरण में भेजा जाता है.

जवाब की जांच करने वाला LLM अक्सर वही होता है जिसने जवाब जनरेट किया है. हालांकि, यह कोई दूसरा एलएलएम भी हो सकता है. जवाब जनरेट करने वाला एलएलएम, अपने जवाब का सही आकलन कैसे कर सकता है? "ट्रिक" यह है कि एलएलएम को आलोचनात्मक (सोचने-समझने वाला) माइंडसेट में रखा जाए. यह प्रोसेस, किसी लेखक की प्रोसेस से मिलती-जुलती है. लेखक, पहला ड्राफ़्ट लिखते समय क्रिएटिव माइंडसेट का इस्तेमाल करता है. इसके बाद, उसे एडिट करते समय क्रिटिकल माइंडसेट का इस्तेमाल करता है.

उदाहरण के लिए, मान लें कि एक एजेंटिक वर्कफ़्लो है. इसका पहला चरण, कॉफ़ी मग के लिए टेक्स्ट बनाना है. इस चरण के लिए प्रॉम्प्ट यह हो सकता है:

मान लें कि आप एक क्रिएटिव हैं. कॉफ़ी मग के लिए, 50 से कम वर्णों वाला मज़ेदार और ओरिजनल टेक्स्ट जनरेट करो.

अब इस तरह के सवाल के बारे में सोचें:

मान लो कि तुम कॉफ़ी पीने वाले व्यक्ति हो. क्या आपको ऊपर दिया गया जवाब मज़ेदार लगा?

इसके बाद, वर्कफ़्लो सिर्फ़ ऐसे टेक्स्ट को अगले चरण में भेज सकता है जिसे रिफ़्लेक्शन स्कोर ज़्यादा मिला हो.

राउटर एजेंट

#agent

यह एजेंट, उपयोगकर्ता की क्वेरी को कैटगरी में बांटता है. इसके बाद, क्वेरी को हैंडल करने के लिए सबसे सही एजेंट को शुरू करता है.

S

खुद से सुधार करने की सुविधा

#agent

एजेंट की यह क्षमता होती है कि वह अपने आउटपुट में गड़बड़ी का पता लगा सके. इसके बाद, वह किसी दूसरे तरीके से काम कर सके.

राज्य

#agent

रीइन्फ़ोर्समेंट लर्निंग में, पैरामीटर की वे वैल्यू जो एनवायरमेंट के मौजूदा कॉन्फ़िगरेशन के बारे में बताती हैं. एजेंट इनका इस्तेमाल करके, कार्रवाई चुनता है.

स्टेट मशीन एजेंट

#agent

ऐसा एजेंट जिसके वर्कफ़्लो पर सख्त नियमों का पालन करने की पाबंदी है. आम तौर पर, स्टेट मशीन एजेंट, ऑटोनॉमस एजेंट की तुलना में कम गलतियां करते हैं. हालांकि, ये अपनी सीमाओं से बाहर की स्थितियों के हिसाब से खुद को नहीं ढाल पाते.

सब एजेंट

#agent

यह एक खास मॉडल है, जो किसी बड़ी समस्या के किसी खास सबसेट को हल करने के लिए, मैनेजर एजेंट की मदद से शुरू किया जाता है. आम तौर पर, एजेंट की तुलना में सब-एजेंट के पास कार्रवाई करने के लिए कम विकल्प होते हैं.

T

खाता बंद करने की शर्त

#agent

एजेंटिक एआई में, पहले से तय किए गए ऐसे मानदंड जो एजेंट को जवाब जनरेट करने से रोकते हैं. उदाहरण के लिए, यहां खाता बंद करने की कुछ संभावित शर्तें दी गई हैं:

  • एजेंट ने लक्ष्य पूरा कर लिया है.
  • एजेंट अब किसी और संसाधन का इस्तेमाल नहीं कर सकता.
  • human-in-the-loop को कोई समस्या मिली है.

रीइन्फ़ोर्समेंट लर्निंग में, वे शर्तें जो यह तय करती हैं कि एपिसोड कब खत्म होगा. जैसे, जब एजेंट किसी खास स्थिति में पहुंच जाता है या स्थिति में बदलाव की थ्रेशोल्ड संख्या से ज़्यादा हो जाता है. उदाहरण के लिए, टिक-टैक-टो (इसे नट्स ऐंड क्रॉस भी कहा जाता है) में, कोई एपिसोड तब खत्म होता है, जब कोई खिलाड़ी लगातार तीन स्पेस मार्क कर देता है या जब सभी स्पेस मार्क कर दिए जाते हैं.