iT邦幫忙

2023 iThome 鐵人賽

DAY 4
0
AI & Data

擁抱AI - 瞭解AI的各項技術範疇及應用領域系列 第 9

[Day 9] 強化式學習(Reinforcement Learning, RL)

  • 分享至 

  • xImage
  •  

今天我們來介紹強化式學習。

強化式學習是甚麼

強化式學習是機器學習的一種,系統藉由與環境不斷重複地互動,來學習應如何正確地執行一項任務。強化式學習的核心概念是「獎勵」,系統會根據其行動所獲得的獎勵來調整其行為,以期獲得最大化的獎勵。

強化式學習的特色

  1. 不須事先標註資料: 強化式學習如非監督式學習,它在訓練前不會事先給資料進行標註,而是當機器判斷後回應判斷結果是否準確。

  2. 獎勵機制: 強化式學習的核心概念是獎勵,電腦會根據其行動所獲得的獎勵來調整其行為,經由不斷獲得獎勵,辨識也將越來越準確。

  3. 需要大量的資料: 因地1, 2點緣故,強化式學習需要大量的資料來訓練,他們需要從大量資料中尋找其規律。

強化式學習優點

  1. 可以學習如何在複雜的環境中做出決策,即使環境是未知或不確定的。
  2. 可以學習如何在沒有人為干預的情況下自我完善。
  3. 可以用於解決具有挑戰性的任務,例如遊戲、機器人和自動駕駛。(這個等下會講到)

強化式學習缺點

  1. 需要長時間的訓練過程,尤其是在環境複雜或獎勵稀疏的情況下。
  2. 可能會導致學習到的策略不穩定,也就是說,在不同的環境或條件下可能會產生不同的結果。

強化式學習應用

  1. AlphaGo: 這個應該是最著名的案例之一
  2. 自動車駕駛: 這個也是最著名的案例之一
  3. 掃地機器人:強化式學習可以用來訓練機器人執行各種任務,例如走路、打掃和搬運貨物。

上一篇
[Day 8] 大型語言模型(Large Language Model, LLM)
下一篇
[Day 10] Confusion Matrix
系列文
擁抱AI - 瞭解AI的各項技術範疇及應用領域14
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言