iT邦幫忙

2025 iThome 鐵人賽

DAY 3
0

前言

前一篇大概介紹了甚麼是Agent,今天來深入了解一下Agent 架構~


AI Agent 感知、思考、行動循環

AI Agent 的核心運作模式是 Perception → Decision → Action → Learning

  1. 感知 (Perception):接收環境資訊、使用者目標與系統狀態。
  2. 思考 / 決策 (Decision-making):LLM 進行推理、任務拆解與步驟規劃。
  3. 行動 (Action):呼叫工具、API、系統操作以執行任務。
  4. 學習 (Learning / Reflection):從結果與回饋中調整策略,提升後續效能。

這個循環使 AI Agent 不只是「回答問題的聊天機器人」,而是可以長期執行目標任務的智慧助理。

  • 需要注意的是,這裡的「學習」通常不是模型自己進化,而是透過對話記憶、外部知識庫或 prompt 優化,來模擬學習與成長的效果。

舉例來說,當你說「今天天氣不好,再放點輕鬆音樂」時,AI Agent 可以:

  1. 查詢天氣:呼叫氣象 API 確認今日天氣狀況
  2. 播放音樂:在 Spotify 播放符合當下氛圍的輕音樂

你只需要用自然語言下達任務,Agent 就能幫你把事情辦妥,這就是 AI Agent 的魅力 一句話,搞定一切


三層架構解析

AI Agent 技術架構可分為 三層

  1. 模型層 (Model Layer)

    • 核心是 LLM,如 GPT-4、Claude、Gemini
    • 負責理解使用者目標與語意,生成初步指令
  2. 推理層 / 指揮層 (Orchestration / Planning Layer)

    • 任務拆解與規劃流程
    • 決定哪個工具或 API 最適合執行
    • 常見框架:LangChain、AutoGen、LlamaIndex
  3. 工具層 (Tools Layer)

    • 呼叫外部服務、資料庫、CRM、雲端工具
    • 將決策轉化為實際操作

流程示例:
需求:「幫我找台北 3 星飯店 + 交通方式」

  • 模型層:理解需求
  • 推理層:拆解步驟 → 找飯店 → 比價 → 查交通
  • 工具層:呼叫 Agoda API、Google Maps API → 整合結果回覆使用者

RPA 與 AI Agent 的本質差異

特徵 RPA(傳統自動化) AI Agent
任務類型 固定、重複流程 動態、跨工具、多步驟任務
智能程度 低:規則驅動 高:可推理、規劃、反思
彈性 低:遇例外需人工干預 高:可根據上下文調整策略
工具使用 預先設定好的流程 可自主呼叫 API、資料庫、系統
適用場景 報表整理、批次作業 跨工具協作、研究助理、行程規劃、決策支援

結論:RPA 適合重複性流程,AI Agent 適合動態、多步驟、跨系統的複雜任務。


Single-Agent vs Multi-Agent 架構比較

定義與形式

架構 定義
Single-Agent 一個 Agent 負責所有任務,內含全部工具與指令,適合簡單流程
Multi-Agent (Supervisor) 主 Agent 分派子 Agent 任務,再彙整結果
Multi-Agent (Handoff) 多個平等 Agent 可互相移交任務,僅一個活躍執行

實驗比較結果(ihower)

  • 單一 Agent:任務簡單、工具少時效能最佳
  • Multi-Agent (Handoff):面對多元任務 + 煩雜工具時表現最穩定
  • Multi-Agent (Supervisor):需 Lead Agent 協調,效率略遜

越複雜的場景,Multi-Agent 架構更具抗干擾能力。

綜合比較表

架構 優點 適用情境
Single-Agent 簡單、快速開發、資源效率高 功能集中、任務單一、原型設計
Multi-Agent 易擴展、資源分工明確、彈性高、容錯佳 複雜場景、動態環境、多任務協作

應用場景示例

  • Single-Agent:問答 Bot、自動回覆、文章生成、簡單資料處理
  • Multi-Agent:行程規劃(旅遊、會議)、跨工具整合、自動化工作流、複雜研究
  • RPA:重複性辦公流程,如報表生成、資料整理、系統操作

AI Agent 的優勢

  1. 自主性:可以自我推理、決策與執行
  2. 工具整合能力:可調用多種 API 與外部應用
  3. 動態規劃:可拆解任務、安排步驟與資源
  4. 記憶能力:保留上下文與歷史互動
  5. 反思能力:檢查與修正錯誤,提升可靠度

AI Agent 的限制

  1. 幻覺問題:可能生成不準確或錯誤資訊
  2. 成本高:需要大量運算與 API 調用
  3. 可控性:自主性高 → 難以完全預測行為
  4. 隱私與安全:資料存取需嚴格管理
  5. 可解釋性不足:決策流程可能為黑箱

RPA vs AI Agent 流程對照圖

flowchart TD
    A[RPA 任務開始] --> B{規則流程?}
    B -->|是| C[依固定流程執行]
    B -->|否| D[人工干預]
    C --> E[完成任務]
    D --> E

    subgraph AI_Agent [AI Agent 任務流程]
        F[接收目標任務] --> G[模型層:理解目標]
        G --> H[推理層:規劃步驟]
        H --> I[工具層:呼叫 API / 系統操作]
        I --> J[結果整合與回饋]
        J --> K[檢查 & 反思]
        K --> L[完成任務]
    end

結束廢話

有沒有更了解AI Agent 呢?
(應該有吧>︿<)

今天這一篇就結束囉~ 我們下一篇見! (≧▽≦)/~
reference link


上一篇
[Day 2] 什麼是 AI Agent?
下一篇
[Day 4] AI Agent Google ADK ?
系列文
AI Agent 開發養成記:做出屬於自己的Agent P8
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言