本頁面包含 Agentic 詞彙表術語。如要查看所有詞彙,請按這裡。
A
act
代理迴圈中的一個階段,代理會在原因階段執行所選動作。舉例來說,動作階段可能會傳送 API 要求。
動作
在增強學習中,代理會透過狀態轉換機制,在環境中運作。代理會使用政策選擇動作。
動作空間
代理程式可用來執行工作的一組資源。動作空間可能包含代理程式可叫用的工具和 API,以及代理程式擁有的權限。一般來說,動作空間應足夠大,可供代理程式執行工作。如果動作空間太小,代理程式可能沒有足夠的資源來執行工作。如果動作空間過大,代理程式就越容易出錯。
代理程式
這類軟體可以根據使用者輸入的內容進行推論,然後代表使用者規劃及執行動作。
在強化學習中,代理程式是使用政策的實體,可盡量提高從環境的狀態轉換所獲得的預期報酬。
聽命行事
代理功能的形容詞形式。代理式是指代理具備的特質 (例如自主性)。
代理迴圈
代理會反覆執行的週期,直到符合終止條件為止。這個週期通常包含下列四個階段:
代理工作流程
代理會自主規劃及執行行動,以達成目標,這個過程可能涉及推論、叫用外部工具,以及自行修正計畫。
代理自動化調度管理
集中管理及轉送多個子代理程式或 LLM 呼叫的工作。代理程式協調功能會將複雜工作拆解成較小的子工作,並指派給最合適的子代理程式。
自主代理
代理會規劃、採取行動及調整策略,以達成複雜目標,不需真人持續介入。
E
評估人員代理
代理程式會在其他代理程式的結果最終確定前,評估這些結果。您可以想像一個代理程式負責製造產品,另一個代理程式 (評估代理程式) 則負責在產品發布前進行測試。
「評論家」是評估代理的同義詞。
F
提供意見
代理循環中的一個階段,代理會在該階段評估行動階段採取的行動。舉例來說,如果代理程式在「行動」階段傳送 API 要求,則「意見回饋」階段可能會判斷 API 回應是否成功。
G
Gemini 模型
Google 最先進的 Transformer 架構多模態模型。Gemini 模型專為與代理程式整合而設計。
使用者可以透過各種方式與 Gemini 模型互動,包括透過互動式對話介面和 SDK。
生成式代理 (擬像)
代理人擁有獨特的人格、記憶和日常活動,可模擬真實的人類行為。
詳情請參閱生成式代理程式:人類行為的互動式模擬。
M
管理代理程式
控制一或多個子代理的代理。
多代理協作
多個專業 AI 代理互動、辯論或將任務傳遞給彼此,以解決複雜問題的框架。
O
觀察
代理會在代理迴圈的此階段檢查或評估代理進度的某個方面。舉例來說,假設 act 階段會產生一些程式碼。因此,觀察階段可能會對生成的程式碼執行測試。
P
規劃和解決
這項策略會先讓模型草擬明確的多步驟計畫,再嘗試執行任何動作。
外掛程式
標準化模組化工具,可輕鬆附加至代理程式,擴充其功能。舉例來說,GitHub 外掛程式可讓代理程式執行讀取 GitHub 問題和建立提取要求等動作。
程序記憶
代理程式:瞭解如何執行某項操作。舉例來說,Agent 可能會發展出如何搜尋網路的程序記憶,然後顯示前三個網站。
R
原因
代理程式迴圈中的階段,代理程式會在此階段決定要執行的動作。舉例來說,代理程式可能會決定要傳送特定 API 要求。
反思
這項策略可改善代理工作流程的品質,方法是在將步驟的輸出內容傳遞至下一個步驟前,先檢查 (反思) 該輸出內容。
審查員通常是生成回覆的同一 LLM (但也有可能是不同的 LLM)。生成回覆的 LLM 如何公正評估自己的回覆?「訣竅」是讓 LLM 進入批判性 (反思) 思考模式。這個過程類似於作家先以創意的心態撰寫初稿,然後切換到批判性思維進行編輯。
舉例來說,假設代理工作流程的第一步是建立咖啡杯的文字。這個步驟的提示可能如下:
你是創意人員,生成適合印在咖啡杯上、長度少於 50 個半形字元的原創幽默文字。
現在,請想像下列反思提示:
你是咖啡愛好者。您覺得先前的回覆有趣嗎?
工作流程隨後可能只會將獲得高反思分數的文字傳遞至下一個階段。
路由器代理程式
這個代理程式會分類使用者查詢,然後叫用最合適的代理程式來處理。
日
自我修正
代理程式能否偵測到自身輸出內容中的錯誤,然後嘗試其他做法。
州
在強化學習中,參數值會說明環境的目前設定,代理程式會使用這些參數值選擇動作。
狀態機代理程式
代理:工作流程受到嚴格規則限制。狀態機代理程式通常比自主代理程式少出錯,但缺乏自由度,無法適應限制以外的情況。
子代理程式
由管理員代理呼叫的專業模型,專門處理較大問題的特定子集。子代理的動作空間通常比代理窄。
T
終止條件
在代理式 AI 中,預先定義的條件會告知代理程式停止疊代。舉例來說,以下是幾種可能的終止條件:
- 代理程式已順利完成目標。
- 代理無法再使用任何資源。
- human-in-the-loop偵測到問題。
在強化學習中,決定集數何時結束的條件,例如代理程式達到特定狀態或超過狀態轉換的門檻數。舉例來說,在井字遊戲中,當玩家連續標記三個空格,或所有空格都已標記時,集數就會終止。