This article contains a lot of technical terms. If you are not familiar with them, please feel free to give up
寫在這邊是為了幫助對於machine learning 毫無概念的人一個想像.
此篇文章適合的人群是那些對軟體有概念但對於ML毫不理解的人, 建立一個最基礎的想像.
老實說AI更像是一則marketing術語而不是科技產物. 這邊該略的講一下什麼是Machine learning.
分類的方法有千千萬萬種, 筆者用的是Andrew Ng的方法, 他把ML分成三個大類:
RL
網路上詳細的解說很多, 這邊就不多說了. 一般開發對戰用的AI, 會用到Reinforcement learning.
坦白說, RL是相較於前兩個比較不成熟的領域. 也許有的人會覺得機器人領域的AI已經很成熟. 但就連領頭羊Boston Dynamic都不是用RL去實現機器人.
為了讓讀者能更清楚的知道為什麼是RL這邊舉一個例子.
你的眼前有兩台拉霸機, 中獎機率不一樣. 每次玩都要投入 1$. 如果贏了就會有 N$ 的獎金. 你要怎麼玩才能贏最多的錢?
和監督式學習不ㄧ樣. 你並沒有已知標記過的樣本. 這跟圖像辨識是貓還是狗不一樣. 你並不知道正確解答, 甚至用來學習的資料都不存在.
也和非監督式學習不一樣. 目標並不是找出某個特徵. 或許你會說如果找到某個概率值你就可以開始做正確的策略拉霸. 但是RL的醍醐味包含了產生測試資料的過程.