一般在分類的問題我們就是要,找出在不同的資料類別中的分隔線。但在一般狀況下這個分隔線非常複雜且有很多種可能。然而SVM就是要在這很多種的可能當中找出最佳的解。SVM演算法的精神就是找出一條分隔線使所有在邊界上的點離得越遠越好,使模型抵抗雜訊的能力更佳。
SVM 能夠透過 C 來達到 weight regularization 來限制模型的複雜度,C越小表示對模型容錯空間過大。除了這點我們還能透過 SVM 的 Kernel trick 的方式將資料做非線性轉換,常見的 kernel 除了 linear 線性以外還有兩了非線性的Polynomial 高次方轉換以及 Radial Basis Function 高斯轉換。
本系列教學簡報 PDF & Code 都可以從我的 GitHub 取得!