iT邦幫忙

2025 iThome 鐵人賽

DAY 13
0
自我挑戰組

AI Agentu相關研究系列 第 13

強化學習(RL)範例實作分析

  • 分享至 

  • xImage
  •  

FrozenLake(冰湖環境)
FrozenLake 是 OpenAI Gym 提供的經典 RL 測試環境:
地圖是格子狀,有冰面(可走)、陷阱洞(掉下去失敗)、終點(抵達成功)。
AI 每次可以選擇「上下左右」走一步。
如果走到終點就 +1 分,掉洞或其他狀況都是 0 分。
https://ithelp.ithome.com.tw/upload/images/20250819/20178004bmyJsEjc43.jpg

分析
狀態(State):冰湖的每個格子位置,就是一個狀態。
動作(Action):上下左右移動。
回饋(Reward):到終點 = +1,其它 = 0。這種設計讓 AI 必須自己摸索路徑。

這個範例就像「走迷宮」,AI 一開始亂走,常常掉到洞裡;但隨著經驗累積,它會知道「哪裡不能走」、「哪條路通往終點」。最後它的策略會變成一條穩定的「最短路徑」。


上一篇
LLM和AI Agent 的實際應用
下一篇
Q-learning 是如何運作的?
系列文
AI Agentu相關研究27
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言