機器學習是一種透過資料、特徵擷取以及訓練的方式,來幫助電腦能夠學習並且辨認出特定領域的知識。而機器學習所運用的領域非常廣泛,例如圖像/影像辨識、自然語言處理、特徵辨識、搜尋引擎、語音辨識、手寫文字辨識......等等,而基於以上這些延伸出來的應用更是不勝枚舉,例如自動駕駛系統、醫學輔助、自動化儀器等等。
前面在介紹AI發展史的時候有聊過歷史上發生的兩次寒冬,而機器學習發展的興盛與衰敗也與這些歷史息息相關。
1980年代AI經過第一次寒冬後開始復甦,其中一部分的原因就是機器學習開始盛行,此時科學家們把機率、統計等大量理論結合類神經網路的發展,讓電腦能夠透過這些資料來學習新的技能,也就是所謂的機器學習。
然而到了第二次AI寒冬時,人們發現機器學習/類神經網路雖然有趣,但實際做出來的成果也不一定比其他傳統的統計方法來的好,反而需要使用更多的資源。
一直到2006年,Geoffrey Hinton教授成功解決了類神經網路的瓶頸、並用了改良過後的深度學習的讓機器學習再一次的回到大眾的目光並且帶動新一波的AI高潮。
如果要簡單說明機器學習到底是什麼的話,我們用以下這樣的觀念來解釋他:
例如
我是誰?
皮卡丘~
而機器學習裡面我們可以分為幾個類型:
1. 監督式學習 (Supervised Learning)
監督式學習,顧名思義,人類必須扮演類似老師一般監督著機器的角色。在監督式學習中,我們對於Input給電腦的Data中都必須要先由人類做好標註,而這裡面包含了特徵和結果。以前面的例子來說,每一張狗跟貓的照片,我們必須要告訴電腦裡頭的特徵以及他是狗還是貓,例如有沒有爪子、有沒有肉球、牙齒耳朵的形狀、毛髮顏色等等,而每一張照片也必須要讓電腦知道它的正確答案是什麼。那麼經過幾萬張照片的訓練之後,電腦就能依照前面訓練出來的經驗去判斷新的一張照片是貓還是狗。
2. 無監督式學習 (Unsupervised Learning)
無監督式學習則是把前面人類標註特徵與結果的部份給省略,因此依樣餵給電腦數萬張貓與狗的照片,但卻不告訴電腦每張照片裡有什麼特徵以及每張照片對應的是狗還是貓,期望電腦能夠自己在這些照片中找出規律 (訓練)。
3. 半監督式學習 (Semi-supervised Learning)
半監督式學習則是介於兩者之間,對於Input給電腦的資料裡面,只有少部分給予答案給電腦當作參考,並讓電腦依據這些去把剩下的照片找出特徵並分類。可以理解成上課時,老師只教你部分的題目跟答案,請你回家後自己把剩下的部分搞懂並完成。
4. 強化式學習 (Reinforcement Learning)
強化學習相對於前面三項比較不同,想下一下人類要做決定時通常會依據當下的環境狀態來選擇要做什麼決定 (動作)。而執行了選擇的決定(動作)後,環境會給予做決定的人一個回饋,而執行的動作也會改變當下的環境狀態,使得當下的環境狀態進入到新的狀態。
因此機器在做強化式學習時,流程就是觀察現在的環境狀態 => 選擇動作並且執行 => 收到環境給予的回饋並重新觀察新的環境狀態
而另一個不同之處在於,增強學習時並不會一次把所有的資料全部丟給電腦,而是不斷的餵給電腦,再經過上面的機制去做修正改進。
那麼明天我們再來聊聊最後深度學習的部分,以及為什麼到了這幾年機器學習/深度學習相較與過往能有如此大的進展與強化,接著我們就會正式開始聊聊AI與作曲。