Day2: Agentic LLM overview

2025 iThome 鐵人賽

DAY 2

生成式 AI

agent-brain: 從 0 開始打造一個 python package系列第 2 篇

17th鐵人賽

aquila_w

2025-09-16 23:35:54

162 瀏覽

分享至

前言

在正式切入實作之前，我想先從 2025 年的角度，帶大家也帶自己重新 overview 一下 Agentic LLM 的發展方向，並且釐清我想要打造的 agent-brain 在整個 Agentic LLM 生態中的定位。

What is Agentic in LLM

不免俗的還是需要提一下什麼是 Agent

「Agent」這個詞在 Reinforcement Learning (RL) 領域非常常見。上圖展示了 RL 中經典的架構：Agent 接收來自環境的 observation（以及 reward），再決定下一個 action，並透過不斷循環直到環境或 Agent 自己終止，來完成任務 (Trajectory)。像是 AlphaGo 就是一個典型的 Agent：棋盤狀態是 observation，下棋的位置就是 action。

如果把這個概念套回 LLM，情況會更直觀。LLM 我們很熟悉，它能處理許多簡單問題，例如翻譯、講笑話，或回答「台灣最高的山是什麼？」但當問題變得複雜，或涉及 LLM 未見過的知識，它就可能產生幻覺或答錯。最直接的解法就是給它外部參考資料（reference），甚至工具（tools），讓 LLM 去使用或者是參考。最常見的例子就是 web search：就像人類不懂就先 Google 一樣。
在這樣的迴圈裡，Agent 就是 LLM，action 是「發出 web search 查詢」，而 observation 則是搜尋結果。如果第一次沒搜到，就換個關鍵字再試，這就是 multi-loop 行為。

Sort of Agentic LLM

目前 Agentic LLM 的類型相當多元。上述提到的單一 Agent 之外，微軟團隊在 Autogen [1] 這篇 paper 中，甚至整理出更多 multi-Agent 協作的不同模式，更像是一個團體預計要處理更複雜的任務。這也從 high level 角度來看 Agentic LLM 的兩大分支：

這邊參考了 openai: A practical guide to building agents [2] 的文章進行解釋

Single-Agent system：單一 Agent 能透過各式各樣的工具來解決問題。
Multi-Agent system：多個 Agent 各自扮演不同角色，透過溝通與分工來完成更複雜的任務。

Single-Agent System

很直觀的就是某個 agent 有很多 tools 可以使用

Multi-Agent System

主要分為兩大種類

有 Central manager 的 multi-agent system (有個中央指揮官)
- 把其他 agents 當作是 tools 來使用 (我自己是覺得這跟 single agent 有點像)
Decentralized 的 multi-agent system (大家流水線的把工作往下交付)
- openai 在文章有用 Handoff 來形容這件事情，Agent1 做完後交給 Agent2 就不管了
- Autogen 的 multi-agent pattern 我自己覺得跟這比較類似，但有很多服雜的 pattern

何時考慮 multi-agent system ?

盡可能的強化 single agent 能力，避免馬上就跳進去做 multi-agent 有 over designed 的嫌疑
workflow 複雜到你可能同時需要多種不同的 prompt 與 tools，才拆分成 multi-agent

Focus on Single Agent System

對於大多數應用場景來說，單一 Agent 加上適當的工具，已經能處理相當廣的需求。例如一個 Agent 能同時使用 web search、API 查詢、資料庫檢索，甚至再進一步把另一個 Agent 當成一個「工具」 (先暫時把這個當成 single agent)。
因此，我這次 Project 的重心會聚焦在 單一 Agent 的設計，特別是如何讓它在規劃 (planning) 與決策 (decision-making) 上更加智能化。這正是這次想提的 agent-brain：它不直接等同於工具，而是專注於規劃與推理的核心模組。