生成式 AI 的最新研究趨勢（如 Agent、工具調用）

2025 iThome 鐵人賽

DAY 29

生成式 AI

AI創世紀：生成式智慧的無限想像系列第 29 篇

17th鐵人賽

tingaaan

2025-10-13 01:40:00

170 瀏覽

分享至

1.	自治／代理（Autonomous Agents）快速崛起
•	從 AutoGPT、BabyAGI 類樣板到企業級 agent 平台，研究與工程社群聚焦「多步規劃、工具協調、長期記憶與環境互動」的設計。agent 被視為把 LLM 轉化為能執行實際任務的軟體元件。 
2.	工具調用 (Function calling / Tool use) 成為基礎能力
•	廠商 API（如 OpenAI 的 function-calling）與框架（LangChain 類）推動 LLM 輸出結構化呼叫指令，讓模型安全且可控地呼叫外部 API、資料庫或程式。這把「模型會說話」變成「模型會做事」。 
3.	模型自學使用工具（Toolformer 類方法）與提示工程成熟化
•	研究顯示模型可透過自我演練或少量監督學會何時、如何呼叫工具（Toolformer 為代表作），減少人工標註與工程成本。提示工程與自動提示／提示優化（prompt optimization）也成為關鍵技術。 
4.	從 RAG（檢索-生成）到更安全的 agent-based 存取企業資料
•	傳統把內部資料匯到向量 DB 的 RAG 方法在安全、授權與 stale-data 問題上面臨挑戰；企業開始採用 agent 在 runtime 直接查詢原始系統（保留原有存取控制），或混合採用以降低風險。 
5.	訓練與調整：RLHF 演化為 RLAIF / DPO / 更可擴展的方案
•	為了可伸縮的對齊，研究從人工回饋（RLHF）往以自動化或 AI 回饋（RLAIF）、直接偏好優化（DPO）等方法演進，既能降低成本也能保持或提升指令追隨與安全性。 
6.	評估與基準化（Agent 評測）成為研究重心
•	隨著 agent 能力擴張，社群出現大量專門評測（planning、tool-use、長程任務成功率、安全測試）的基準集合，評測標準正快速演化。 
7.	多模態與端到端整合（Text ↔ Image ↔ Audio ↔ Video）
•	最新大型模型（含開源）更注重多模態支援，讓 agent 能直接處理多種感知訊息並呼叫適切工具（例如處理圖片後再呼叫 OCR/API）。這對實務應用（客服、醫療影像、製造檢測）很有價值。