今天來介紹AI Agent是什麼,大多時候我們使用LLM時,都是我們提出問題,AI生成回應。
而AI Agent不同的地方在於是把LLM放進一個迴路中,給它目標、工具與記憶,讓它能自己規劃步驟、呼叫外部工具、反思修正,直到達成任務。
什麼是 AI Agent?
AI Agent是一個可以目標導向規劃、使用工具、記憶狀態、反思的LLM。
能力
拆解任務、擬定計畫
依序行動、呼叫工具
儲存與讀取上下文
自我檢查再修正
終止條件與回報
什麼時候需要Agent大於單次的詢問?
多步驟工作 : 同時需要搜集→彙整→產出
需要多工具 : API、資料庫、爬蟲、試算表等
長期任務 : 如每日例行、監控
常見的設計樣式
ReAct:先寫出思考步驟,再選擇工具行動,循環直到完成。
Tool/Function Calling:讓模型自己選函式,由系統實際執行。
Planner–Executor:一個模型負責規劃,一個模型按計畫執行。
MRKL/Router:根據問題把請求路由到最合適的工具/子模型。
安全治理
避免讓Agent作一些不被允許的行為。
工具白名單:只開放安全函式,禁止系統級命令。
回合與時間上限:規定幾步內必須完成,避免無限循環與帳單爆炸。
費用與速率:紀錄每步token/花費,失控即中止。
輸入清洗:移除URL追蹤碼、限制檔案型別,防注入。
人工關卡:高風險步驟前必須人工確認。
評估一個Agent的好壞指標
成功率 : 任務是否達標?
成本 : 值不值得?
延遲 : 速度可以接受嗎?
穩定性 : 結果是否一致?
需要人工介入率 : 幾步需要人?
安全事件 : 有無越權/錯誤行動?