iT邦幫忙

sarsa相關文章
共有 1 則文章
AI 高中生的自我學習 系列 第 28

技術 Day 28 - 強化學習 Reinforcement Learning(2)

時差學習 Temporal difference learning link 時差學習是通過boottraping自助(link)從值函數的當前估計中進行學習。...