1. 自治/代理(Autonomous Agents)快速崛起
• 從 AutoGPT、BabyAGI 類樣板到企業級 agent 平台,研究與工程社群聚焦「多步規劃、工具協調、長期記憶與環境互動」的設計。agent 被視為把 LLM 轉化為能執行實際任務的軟體元件。 
2. 工具調用 (Function calling / Tool use) 成為基礎能力
• 廠商 API(如 OpenAI 的 function-calling)與框架(LangChain 類)推動 LLM 輸出結構化呼叫指令,讓模型安全且可控地呼叫外部 API、資料庫或程式。這把「模型會說話」變成「模型會做事」。 
3. 模型自學使用工具(Toolformer 類方法)與提示工程成熟化
• 研究顯示模型可透過自我演練或少量監督學會何時、如何呼叫工具(Toolformer 為代表作),減少人工標註與工程成本。提示工程與自動提示/提示優化(prompt optimization)也成為關鍵技術。 
4. 從 RAG(檢索-生成)到更安全的 agent-based 存取企業資料
• 傳統把內部資料匯到向量 DB 的 RAG 方法在安全、授權與 stale-data 問題上面臨挑戰;企業開始採用 agent 在 runtime 直接查詢原始系統(保留原有存取控制),或混合採用以降低風險。 
5. 訓練與調整:RLHF 演化為 RLAIF / DPO / 更可擴展的方案
• 為了可伸縮的對齊,研究從人工回饋(RLHF)往以自動化或 AI 回饋(RLAIF)、直接偏好優化(DPO)等方法演進,既能降低成本也能保持或提升指令追隨與安全性。 
6. 評估與基準化(Agent 評測)成為研究重心
• 隨著 agent 能力擴張,社群出現大量專門評測(planning、tool-use、長程任務成功率、安全測試)的基準集合,評測標準正快速演化。 
7. 多模態與端到端整合(Text ↔ Image ↔ Audio ↔ Video)
• 最新大型模型(含開源)更注重多模態支援,讓 agent 能直接處理多種感知訊息並呼叫適切工具(例如處理圖片後再呼叫 OCR/API)。這對實務應用(客服、醫療影像、製造檢測)很有價值。