隨著大型語言模型(Large Language Models, LLM)在各種應用中普及,我們會發現:光靠 LLM 本身的知識與推理,仍然存在一些限制。舉例來說...
當 LLM(會理解、對話、規劃)與 AI Agent(會執行、操作、整合工具)結合後,應用就不再只是「聊天」或「單一功能」,而是能形成 完整的任務自動化流程。以...
FrozenLake(冰湖環境)FrozenLake 是 OpenAI Gym 提供的經典 RL 測試環境:地圖是格子狀,有冰面(可走)、陷阱洞(掉下去失敗)、...
在強化學習(Reinforcement Learning, RL)裡,Q-learning 是最經典也最常見的演算法之一。它的目標很單純:讓一個智能體(Agen...
什麼是 DQN? DQN(Deep Q-Network)是一種 強化學習(Reinforcement Learning, RL)方法,它將傳統的 Q-learn...
在強化學習(Reinforcement Learning, RL)中,AI Agent 要在環境中做出決策並學習最優行為,核心概念有兩個:值函數(Value F...
為什麼需要記憶模組? 如果你和 AI Agent對話,卻發現它忘了剛剛說過的話,或無法延續上下文,那麼這個 Agent 的「記憶模組」就是缺失的。記憶(Memo...
LangChain 是一個專門為大語言模型(LLM, Large Language Model) 打造的開發框架。在還沒有 LangChain 的年代,開發者使...
什麼是 Multi-Agent 系統? Multi-Agent 系統(MAS, Multi-Agent System)是一種由多個 智能體(Agent) 所組成...
AutoGen 是什麼? AutoGen 是一個由微軟研究院提出的開源框架,主要目的是 讓多個 AI Agent 可以高效互動,並且能 融入人類的回饋(Huma...