iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
自我挑戰組

AI Agentu相關研究 系列

將AI Agentu由淺入深認識

參賽天數 26 天 | 共 26 篇文章 | 2 人訂閱 訂閱系列文 RSS系列文
DAY 11

(承接上文)LLM如何呼叫外部工具

隨著大型語言模型(Large Language Models, LLM)在各種應用中普及,我們會發現:光靠 LLM 本身的知識與推理,仍然存在一些限制。舉例來說...

2025-08-17 ‧ 由 S1111132020 分享
DAY 12

LLM和AI Agent 的實際應用

當 LLM(會理解、對話、規劃)與 AI Agent(會執行、操作、整合工具)結合後,應用就不再只是「聊天」或「單一功能」,而是能形成 完整的任務自動化流程。以...

2025-08-18 ‧ 由 S1111132020 分享
DAY 13

強化學習(RL)範例實作分析

FrozenLake(冰湖環境)FrozenLake 是 OpenAI Gym 提供的經典 RL 測試環境:地圖是格子狀,有冰面(可走)、陷阱洞(掉下去失敗)、...

2025-08-19 ‧ 由 S1111132020 分享
DAY 14

Q-learning 是如何運作的?

在強化學習(Reinforcement Learning, RL)裡,Q-learning 是最經典也最常見的演算法之一。它的目標很單純:讓一個智能體(Agen...

2025-08-20 ‧ 由 S1111132020 分享
DAY 15

AI Agent與 Deep Q-Network(DQN)的關係

什麼是 DQN? DQN(Deep Q-Network)是一種 強化學習(Reinforcement Learning, RL)方法,它將傳統的 Q-learn...

2025-08-21 ‧ 由 S1111132020 分享
DAY 16

AI Agent 的值函數與政策

在強化學習(Reinforcement Learning, RL)中,AI Agent 要在環境中做出決策並學習最優行為,核心概念有兩個:值函數(Value F...

2025-08-22 ‧ 由 S1111132020 分享
DAY 17

AI Agent 的記憶模組(Memory)

為什麼需要記憶模組? 如果你和 AI Agent對話,卻發現它忘了剛剛說過的話,或無法延續上下文,那麼這個 Agent 的「記憶模組」就是缺失的。記憶(Memo...

2025-08-23 ‧ 由 S1111132020 分享
DAY 18

LangChain 是什麼?

LangChain 是一個專門為大語言模型(LLM, Large Language Model) 打造的開發框架。在還沒有 LangChain 的年代,開發者使...

2025-08-24 ‧ 由 S1111132020 分享
DAY 19

Multi-Agent 系統 (MAS)

什麼是 Multi-Agent 系統? Multi-Agent 系統(MAS, Multi-Agent System)是一種由多個 智能體(Agent) 所組成...

2025-08-25 ‧ 由 S1111132020 分享
DAY 20

AutoGen 概念與架構

AutoGen 是什麼? AutoGen 是一個由微軟研究院提出的開源框架,主要目的是 讓多個 AI Agent 可以高效互動,並且能 融入人類的回饋(Huma...

2025-08-26 ‧ 由 S1111132020 分享