AI Agentu相關研究 :: 2025 iThome 鐵人賽

S1111132020 (S1111132020)

iT邦見習生 ‧ 點數 134

1427

累計瀏覽數

1人

在追蹤

站內簡訊追蹤

鐵人檔案

2025 iThome 鐵人賽

回列表

自我挑戰組

AI Agentu相關研究系列

將AI Agentu由淺入深認識

鐵人鍊成｜共 30 篇文章｜ 3 人訂閱訂閱系列文 RSS系列文

0 Like 0 留言 271 瀏覽

DAY 11

（承接上文）LLM如何呼叫外部工具

隨著大型語言模型（Large Language Models, LLM）在各種應用中普及，我們會發現：光靠 LLM 本身的知識與推理，仍然存在一些限制。舉例來說...

2025-08-17 ‧ 由 S1111132020 分享

0 Like 0 留言 245 瀏覽

DAY 12

LLM和AI Agent 的實際應用

當 LLM（會理解、對話、規劃）與 AI Agent（會執行、操作、整合工具）結合後，應用就不再只是「聊天」或「單一功能」，而是能形成完整的任務自動化流程。以...

2025-08-18 ‧ 由 S1111132020 分享

0 Like 0 留言 233 瀏覽

DAY 13

強化學習（RL）範例實作分析

FrozenLake（冰湖環境）FrozenLake 是 OpenAI Gym 提供的經典 RL 測試環境：地圖是格子狀，有冰面（可走）、陷阱洞（掉下去失敗）、...

2025-08-19 ‧ 由 S1111132020 分享

0 Like 0 留言 154 瀏覽

DAY 14

Q-learning 是如何運作的？

在強化學習（Reinforcement Learning, RL）裡，Q-learning 是最經典也最常見的演算法之一。它的目標很單純：讓一個智能體（Agen...

2025-08-20 ‧ 由 S1111132020 分享

0 Like 0 留言 251 瀏覽

DAY 15

AI Agent與 Deep Q-Network（DQN）的關係

什麼是 DQN？ DQN（Deep Q-Network）是一種強化學習（Reinforcement Learning, RL）方法，它將傳統的 Q-learn...

2025-08-21 ‧ 由 S1111132020 分享

0 Like 0 留言 217 瀏覽

DAY 16

AI Agent 的值函數與政策

在強化學習（Reinforcement Learning, RL）中，AI Agent 要在環境中做出決策並學習最優行為，核心概念有兩個：值函數（Value F...

2025-08-22 ‧ 由 S1111132020 分享

0 Like 0 留言 498 瀏覽

DAY 17

AI Agent 的記憶模組（Memory）

為什麼需要記憶模組？如果你和 AI Agent對話，卻發現它忘了剛剛說過的話，或無法延續上下文，那麼這個 Agent 的「記憶模組」就是缺失的。記憶（Memo...

2025-08-23 ‧ 由 S1111132020 分享

0 Like 0 留言 546 瀏覽

DAY 18

LangChain 是什麼？

LangChain 是一個專門為大語言模型（LLM, Large Language Model）打造的開發框架。在還沒有 LangChain 的年代，開發者使...

2025-08-24 ‧ 由 S1111132020 分享

0 Like 0 留言 355 瀏覽

DAY 19

Multi-Agent 系統 (MAS)

什麼是 Multi-Agent 系統？ Multi-Agent 系統（MAS, Multi-Agent System）是一種由多個智能體（Agent）所組成...

2025-08-25 ‧ 由 S1111132020 分享

0 Like 0 留言 379 瀏覽

DAY 20

AutoGen 概念與架構

AutoGen 是什麼？ AutoGen 是一個由微軟研究院提出的開源框架，主要目的是讓多個 AI Agent 可以高效互動，並且能融入人類的回饋（Huma...

2025-08-26 ‧ 由 S1111132020 分享

S1111132020的鐵人檔案

S1111132020的收藏

S1111132020的追蹤

S1111132020的Like

S1111132020的紀錄

S1111132020的訂閱列表

鐵人檔案

AI Agentu相關研究 系列

標記使用者

AI Agentu相關研究系列