今天我們來介紹強化式學習。
強化式學習是機器學習的一種,系統藉由與環境不斷重複地互動,來學習應如何正確地執行一項任務。強化式學習的核心概念是「獎勵」,系統會根據其行動所獲得的獎勵來調整其行為,以期獲得最大化的獎勵。
不須事先標註資料: 強化式學習如非監督式學習,它在訓練前不會事先給資料進行標註,而是當機器判斷後回應判斷結果是否準確。
獎勵機制: 強化式學習的核心概念是獎勵,電腦會根據其行動所獲得的獎勵來調整其行為,經由不斷獲得獎勵,辨識也將越來越準確。
需要大量的資料: 因地1, 2點緣故,強化式學習需要大量的資料來訓練,他們需要從大量資料中尋找其規律。