在正式切入實作之前,我想先從 2025 年的角度,帶大家也帶自己重新 overview 一下 Agentic LLM 的發展方向,並且釐清我想要打造的 agent-brain 在整個 Agentic LLM 生態中的定位。
不免俗的還是需要提一下 什麼是 Agent
「Agent」這個詞在 Reinforcement Learning (RL) 領域非常常見。上圖展示了 RL 中經典的架構:Agent 接收來自環境的 observation(以及 reward),再決定下一個 action,並透過不斷循環直到環境或 Agent 自己終止,來完成任務 (Trajectory)。像是 AlphaGo 就是一個典型的 Agent:棋盤狀態是 observation,下棋的位置就是 action。
如果把這個概念套回 LLM,情況會更直觀。LLM 我們很熟悉,它能處理許多簡單問題,例如翻譯、講笑話,或回答「台灣最高的山是什麼?」但當問題變得複雜,或涉及 LLM 未見過的知識,它就可能產生幻覺或答錯。最直接的解法就是給它外部參考資料(reference),甚至工具(tools)。最常見的例子就是 web search:就像人類不懂就先 Google 一樣。
在這樣的迴圈裡,Agent 就是 LLM,action 是「發出 web search 查詢」,而 observation 則是搜尋結果。如果第一次沒搜到,就換個關鍵字再試,這就是 multi-loop 行為。
目前 Agentic LLM 的類型相當多元。上述提到的單一 Agent 之外,微軟團隊在 Autogen [1] 這篇 paper 中,甚至整理出更多 multi-Agent 協作的不同模式,更像是一個團體 預計要處理更複雜的任務。這也從 high level 角度來看 Agentic LLM 的兩大分支:
這邊參考了 openai: A practical guide to building agents [2] 的文章進行解釋
很直觀的就是某個 agent 有很多 tools 可以使用
主要分為兩大種類
有 Central manager 的 multi-agent system (有個中央指揮官)
Decentralized 的 multi-agent system (大家流水線的把工作往下交付)
何時考慮 multi-agent system ?
對於大多數應用場景來說,單一 Agent 加上適當的工具,已經能處理相當廣的需求。例如一個 Agent 能同時使用 web search、API 查詢、資料庫檢索,甚至再進一步把另一個 Agent 當成一個「工具」 (先暫時把這個當成 single agent)。
因此,我這次 Project 的重心會聚焦在 單一 Agent 的設計,特別是如何讓它在規劃 (planning) 與決策 (decision-making) 上更加智能化。這正是這次想提的 agent-brain:它不直接等同於工具,而是專注於規劃與推理的核心模組。
從大的範疇一路收斂:
接下來,我將深入探討 Single Agent 的架構設計,以及 agent-brain 在其中扮演的角色。
還有28天... 我沒囤稿...
Ref:
[1] AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation
[2] A practical guide to building agents (OpenAI)