介紹完監督式學習與非監督式學習,我們來介紹強化學習!根據wiki的定義
強化學習(英語:Reinforcement learning,簡稱RL)是機器學習中的一個領域,強調如何基於環境而行動,以取得最大化的預期利益。
擷取至wiki
可以看到,強化學習的精隨在於agent如何與環境的互動,來產生最大的利益。
強化學習總共有這幾個元素,Agent,Environment,Action,Reward。
取自https://www.terasoft.com.tw/support/tech_articles/reinforcement_learning_a_brief_guide.asp
Agent會採取Action,採取行動後,環境可能會被改變,而環境會給Agent一個Reward,讓Agent知道這Action好不好。
那麼強化學習有什麼用處呢?
我們可以使用強化學習來訓練圍棋機器人!
知名的Alpha Go 就是基於強化學習來打敗人類的!
又或者學習如何玩超級馬力歐,透過一次又一次的死亡,Agent會慢慢地學習什麼時間點該跳躍閃避怪物,或者殺掉怪物。
當然不是的,強化學習需要大量的訓練,如果要在電玩遊戲中贏過人類,需要的禎數可能要很高,且例如射擊遊戲需要超高的反應速度,目前的強化學習可能還無法應付。
又或者自動駕駛,假設車子已經能完美的沿著路線前進了,且能應對紅綠燈等狀況,但如果因為某些原因,影像辨識誤把紅燈當成了綠燈,這樣可能會導致嚴重的事故。
強化學習是很有趣的,但可能不是這麼萬用,但在一些領域中,可以達到超過人類水準的表現!
強化學習 wiki
AlphaGo使用的強化學習是人工智慧新星?讓專家告訴你為什麼這不是通用解方