我以李弘毅老師所開的機器學習課程學習地圖,作為機器學習會學哪些方法的架構介紹。
綜觀機器學習,我們可以分成學習情境(scenario)、任務(task)跟方法(method)三部分來看。
從訓練時的學習情境(scenario)的角度,可以分成
圖片來源:https://ithelp.ithome.com.tw/articles/10264258
而就資料輸出的格式來說(也可以說是要做的任務, task),可以分成:
回歸主題,我們要做的手寫數字辨識系統是一個在訓練有預設答案(監督式)的分類問題,因為我們會給它input跟目標output的資料,確定得出的結果是數字 0~9 其中一個。
機器學習的方法有直接對照得到答案的線性模型,容易理解但正確率可能不高,也有過程比較複雜的非線性模型,如 Deep Learning(Neural Network),或是其他模型如 SVM、決策樹、K 鄰近法(K-NN) 等。
每種方法都有他們的優缺,按照遇到的問題選用最適合的模型(model) 即可,譬如說使用神經網路時因為黑箱關係,所以不大好解釋結果是怎麼一步一步推論出;或使用決策樹做分類時,若各類樣本數量不均,決策樹推論出來的結果會偏向樣本數量比較多數據的特徵,這些我們後面有機會會詳細講。
明天我們接著講怎麼找一個適合手寫數字辨識系統的神經網路方法~
[註1] 李宏毅老師的 機器學習課程(2017)