iT邦幫忙

2025 iThome 鐵人賽

DAY 2
1

前言

在正式切入實作之前,我想先從 2025 年的角度,帶大家也帶自己重新 overview 一下 Agentic LLM 的發展方向,並且釐清我想要打造的 agent-brain 在整個 Agentic LLM 生態中的定位。

What is Agentic in LLM

不免俗的還是需要提一下 什麼是 Agent
https://www.altexsoft.com/static/blog-post/2023/11/345fadfa-549a-462a-b757-9ab258e747f3.jpg
「Agent」這個詞在 Reinforcement Learning (RL) 領域非常常見。上圖展示了 RL 中經典的架構:Agent 接收來自環境的 observation(以及 reward),再決定下一個 action,並透過不斷循環直到環境或 Agent 自己終止,來完成任務 (Trajectory)。像是 AlphaGo 就是一個典型的 Agent:棋盤狀態是 observation,下棋的位置就是 action。

如果把這個概念套回 LLM,情況會更直觀。LLM 我們很熟悉,它能處理許多簡單問題,例如翻譯、講笑話,或回答「台灣最高的山是什麼?」但當問題變得複雜,或涉及 LLM 未見過的知識,它就可能產生幻覺或答錯。最直接的解法就是給它外部參考資料(reference),甚至工具(tools)。最常見的例子就是 web search:就像人類不懂就先 Google 一樣。
在這樣的迴圈裡,Agent 就是 LLM,action 是「發出 web search 查詢」,而 observation 則是搜尋結果。如果第一次沒搜到,就換個關鍵字再試,這就是 multi-loop 行為。

Sort of Agentic LLM

https://ithelp.ithome.com.tw/upload/images/20250916/20128319znGkMJcmad.jpg
目前 Agentic LLM 的類型相當多元。上述提到的單一 Agent 之外,微軟團隊在 Autogen [1] 這篇 paper 中,甚至整理出更多 multi-Agent 協作的不同模式,更像是一個團體 預計要處理更複雜的任務。這也從 high level 角度來看 Agentic LLM 的兩大分支:

這邊參考了 openai: A practical guide to building agents [2] 的文章進行解釋

  • Single-Agent system:單一 Agent 能透過各式各樣的工具來解決問題。
  • Multi-Agent system:多個 Agent 各自扮演不同角色,透過溝通與分工來完成更複雜的任務。

Single-Agent System

https://ithelp.ithome.com.tw/upload/images/20250916/20128319thzxQtzPKl.jpg
很直觀的就是某個 agent 有很多 tools 可以使用

Multi-Agent System

主要分為兩大種類

  1. 有 Central manager 的 multi-agent system (有個中央指揮官)

    • 把其他 agents 當作是 tools 來使用 (我自己是覺得這跟 single agent 有點像)
      https://ithelp.ithome.com.tw/upload/images/20250916/20128319CBywzl1LyI.jpg
  2. Decentralized 的 multi-agent system (大家流水線的把工作往下交付)

    • openai 在文章有用 Handoff 來形容這件事情,Agent1 做完後交給 Agent2 就不管了
    • Autogen 的 multi-agent pattern 我自己覺得跟這比較類似,但有很多服雜的 pattern
      https://ithelp.ithome.com.tw/upload/images/20250916/20128319MnxmDQcZw7.jpg

何時考慮 multi-agent system ?

  • 盡可能的強化 single agent 能力,避免馬上就跳進去做 multi-agent 有 over designed 的嫌疑
  • workflow 複雜到你可能同時需要多種不同的 prompt 與 tools,才拆分成 multi-agent

Focus on Single Agent System

對於大多數應用場景來說,單一 Agent 加上適當的工具,已經能處理相當廣的需求。例如一個 Agent 能同時使用 web search、API 查詢、資料庫檢索,甚至再進一步把另一個 Agent 當成一個「工具」 (先暫時把這個當成 single agent)。
因此,我這次 Project 的重心會聚焦在 單一 Agent 的設計,特別是如何讓它在規劃 (planning) 與決策 (decision-making) 上更加智能化。這正是這次想提的 agent-brain:它不直接等同於工具,而是專注於規劃與推理的核心模組。

Takeaway

從大的範疇一路收斂:

  • AgentAgentic LLMSingle Agent
    而我想打造的 agent-brain,就是位於 Single Agent 的核心,專注於如何更好地規劃、推理與決策。

to be continue...

接下來,我將深入探討 Single Agent 的架構設計,以及 agent-brain 在其中扮演的角色。

還有28天... 我沒囤稿...

Ref:
[1] AutoGen: Enabling Next-Gen LLM Applications via Multi-Agent Conversation
[2] A practical guide to building agents (OpenAI)


上一篇
Day1: Introduction & planning
下一篇
Day3: 論文導讀 Understanding the planning of LLM agents: A survey (一)
系列文
agent-brain: 從 0 開始打造一個 python package3
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言