iT邦幫忙

2025 iThome 鐵人賽

DAY 29
0
生成式 AI

AI創世紀:生成式智慧的無限想像系列 第 29

生成式 AI 的最新研究趨勢(如 Agent、工具調用)

  • 分享至 

  • xImage
  •  
1.	自治/代理(Autonomous Agents)快速崛起
•	從 AutoGPT、BabyAGI 類樣板到企業級 agent 平台,研究與工程社群聚焦「多步規劃、工具協調、長期記憶與環境互動」的設計。agent 被視為把 LLM 轉化為能執行實際任務的軟體元件。 
2.	工具調用 (Function calling / Tool use) 成為基礎能力
•	廠商 API(如 OpenAI 的 function-calling)與框架(LangChain 類)推動 LLM 輸出結構化呼叫指令,讓模型安全且可控地呼叫外部 API、資料庫或程式。這把「模型會說話」變成「模型會做事」。 
3.	模型自學使用工具(Toolformer 類方法)與提示工程成熟化
•	研究顯示模型可透過自我演練或少量監督學會何時、如何呼叫工具(Toolformer 為代表作),減少人工標註與工程成本。提示工程與自動提示/提示優化(prompt optimization)也成為關鍵技術。 
4.	從 RAG(檢索-生成)到更安全的 agent-based 存取企業資料
•	傳統把內部資料匯到向量 DB 的 RAG 方法在安全、授權與 stale-data 問題上面臨挑戰;企業開始採用 agent 在 runtime 直接查詢原始系統(保留原有存取控制),或混合採用以降低風險。 
5.	訓練與調整:RLHF 演化為 RLAIF / DPO / 更可擴展的方案
•	為了可伸縮的對齊,研究從人工回饋(RLHF)往以自動化或 AI 回饋(RLAIF)、直接偏好優化(DPO)等方法演進,既能降低成本也能保持或提升指令追隨與安全性。 
6.	評估與基準化(Agent 評測)成為研究重心
•	隨著 agent 能力擴張,社群出現大量專門評測(planning、tool-use、長程任務成功率、安全測試)的基準集合,評測標準正快速演化。 
7.	多模態與端到端整合(Text ↔ Image ↔ Audio ↔ Video)
•	最新大型模型(含開源)更注重多模態支援,讓 agent 能直接處理多種感知訊息並呼叫適切工具(例如處理圖片後再呼叫 OCR/API)。這對實務應用(客服、醫療影像、製造檢測)很有價值。 

上一篇
生成式 AI 與「人機協作」的新型工作模式
系列文
AI創世紀:生成式智慧的無限想像29
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言