[Day 3] Agent 架構

2025 iThome 鐵人賽

DAY 3

生成式 AI

AI Agent 開發養成記：做出屬於自己的Agent P系列第 3 篇

17th鐵人賽

neva0214

團隊nutc imac

2025-09-17 15:11:58

188 瀏覽

分享至

前言

前一篇大概介紹了甚麼是Agent，今天來深入了解一下Agent 架構~

AI Agent 感知、思考、行動循環

AI Agent 的核心運作模式是 Perception → Decision → Action → Learning：

感知 (Perception)：接收環境資訊、使用者目標與系統狀態。
思考 / 決策 (Decision-making)：LLM 進行推理、任務拆解與步驟規劃。
行動 (Action)：呼叫工具、API、系統操作以執行任務。
學習 (Learning / Reflection)：從結果與回饋中調整策略，提升後續效能。

這個循環使 AI Agent 不只是「回答問題的聊天機器人」，而是可以長期執行目標任務的智慧助理。

需要注意的是，這裡的「學習」通常不是模型自己進化，而是透過對話記憶、外部知識庫或 prompt 優化，來模擬學習與成長的效果。

舉例來說，當你說「今天天氣不好，再放點輕鬆音樂」時，AI Agent 可以：

查詢天氣：呼叫氣象 API 確認今日天氣狀況
播放音樂：在 Spotify 播放符合當下氛圍的輕音樂

你只需要用自然語言下達任務，Agent 就能幫你把事情辦妥，這就是 AI Agent 的魅力 一句話，搞定一切。

三層架構解析

AI Agent 技術架構可分為三層：

模型層 (Model Layer)
- 核心是 LLM，如 GPT-4、Claude、Gemini
- 負責理解使用者目標與語意，生成初步指令
推理層 / 指揮層 (Orchestration / Planning Layer)
- 任務拆解與規劃流程
- 決定哪個工具或 API 最適合執行
- 常見框架：LangChain、AutoGen、LlamaIndex
工具層 (Tools Layer)
- 呼叫外部服務、資料庫、CRM、雲端工具
- 將決策轉化為實際操作

流程示例：
需求：「幫我找台北 3 星飯店 + 交通方式」

模型層：理解需求
推理層：拆解步驟 → 找飯店 → 比價 → 查交通
工具層：呼叫 Agoda API、Google Maps API → 整合結果回覆使用者

RPA 與 AI Agent 的本質差異

特徵	RPA（傳統自動化）	AI Agent
任務類型	固定、重複流程	動態、跨工具、多步驟任務
智能程度	低：規則驅動	高：可推理、規劃、反思
彈性	低：遇例外需人工干預	高：可根據上下文調整策略
工具使用	預先設定好的流程	可自主呼叫 API、資料庫、系統
適用場景	報表整理、批次作業	跨工具協作、研究助理、行程規劃、決策支援

結論：RPA 適合重複性流程，AI Agent 適合動態、多步驟、跨系統的複雜任務。

Single-Agent vs Multi-Agent 架構比較

定義與形式

架構	定義
Single-Agent	一個 Agent 負責所有任務，內含全部工具與指令，適合簡單流程
Multi-Agent (Supervisor)	主 Agent 分派子 Agent 任務，再彙整結果
Multi-Agent (Handoff)	多個平等 Agent 可互相移交任務，僅一個活躍執行

實驗比較結果（ihower）

單一 Agent：任務簡單、工具少時效能最佳
Multi-Agent (Handoff)：面對多元任務 + 煩雜工具時表現最穩定
Multi-Agent (Supervisor)：需 Lead Agent 協調，效率略遜

越複雜的場景，Multi-Agent 架構更具抗干擾能力。

綜合比較表

架構	優點	適用情境
Single-Agent	簡單、快速開發、資源效率高	功能集中、任務單一、原型設計
Multi-Agent	易擴展、資源分工明確、彈性高、容錯佳	複雜場景、動態環境、多任務協作

應用場景示例

Single-Agent：問答 Bot、自動回覆、文章生成、簡單資料處理
Multi-Agent：行程規劃（旅遊、會議）、跨工具整合、自動化工作流、複雜研究
RPA：重複性辦公流程，如報表生成、資料整理、系統操作

AI Agent 的優勢

自主性：可以自我推理、決策與執行
工具整合能力：可調用多種 API 與外部應用
動態規劃：可拆解任務、安排步驟與資源
記憶能力：保留上下文與歷史互動
反思能力：檢查與修正錯誤，提升可靠度

AI Agent 的限制

幻覺問題：可能生成不準確或錯誤資訊
成本高：需要大量運算與 API 調用
可控性：自主性高 → 難以完全預測行為
隱私與安全：資料存取需嚴格管理
可解釋性不足：決策流程可能為黑箱

RPA vs AI Agent 流程對照圖

flowchart TD
    A[RPA 任務開始] --> B{規則流程?}
    B -->|是| C[依固定流程執行]
    B -->|否| D[人工干預]
    C --> E[完成任務]
    D --> E

    subgraph AI_Agent [AI Agent 任務流程]
        F[接收目標任務] --> G[模型層：理解目標]
        G --> H[推理層：規劃步驟]
        H --> I[工具層：呼叫 API / 系統操作]
        I --> J[結果整合與回饋]
        J --> K[檢查 & 反思]
        K --> L[完成任務]
    end