強化學習的基本概念
由於人類許多任務不只是分類、分群與預測,而存在許多需要依據環境不斷動態變化,採取一系列連續性的決策。
除了利用特徵值的機器學習方法外,植基於「回饋」(Feed-back)來不斷地、連續性地調整機器行為,以達成目標的強化(增強)式學習,當然就成為一種非常重要的主流機器學習模型。
透過每次行動(Action)所得到不同的報酬值(Reward)來決定在目前狀態下(State)應該如何選擇行動策略(Policy)的一種機器學習方法。
強化學習的主要應用
強化學習的主要問題與演算法
強化學習的優缺點
強化學習主要特色
強化應用☞
參考資料
人工智慧-概念應用與管理 林東清著