增強式學習在機器學習中擔任什麼角色呢?它與深度學習又有什麼關係呢?
增強式學習(Reinforcement Learning, RL)是一種機器學習類型,其發展歷程源起於:
1750-1850年 自動化工業革命 --> 1870-1940年 機器時代 -> 1950年至今 重複思維解決方案的自動化 -->
現今目標:
讓機器自己尋找解決方案人工智能,且不需要指定問題和/或目標,透過自主學習如何做出決定,能夠學習做出決定並且最佳化以實現目標
那如何達成自主學習的目標呢?機器透過與一個動態(dynamic)環境不斷重複地嘗試,來學習正確地執行一項任務。藉由自我嘗試錯誤(trial-and-error)的學習方法,使電腦在沒有人類干預、沒有被設定明確的任務下,能夠自主學習做出一系列的決策。因此,增強式學習中,有主要幾項主要的元件來達成目的,分別為:角色(actor)、環境(Environment)、獎勵(Reward)、狀態,找最大化獎勵的學習方式,如下圖。
圖片來源:維基百科
接下來30天,會為各位介紹:
參考資料:
https://ieeexplore.ieee.org/abstract/document/9244647
[Google DeepMind 2021年強化學習系列講座](2021 年強化學習系列講座)
ReinforcementLearning:AnIntroduction,Sutton&Barto2018