今天我們要來介紹SVM(Support Vector Machine)。
假設現在我們要分類圓形還有正方形,那麼以這個例子來說,可以用很簡單的一根棍子來分類,這就是線性可分的。
那麼我們繼續分類圓形還有正方形,但現在有一個正方形跑到左邊了!我們的棍子不管怎麼擺放,都無法分割圓形還有正方形,那麼我們稱這個為線性不可分。
因為線性可分的圖形較為清楚,因此我們使用線性可分來解釋。
SVM是很厲害的人,可以把兩團資料做分類,而他是怎麼做到的呢?
SVM會找到一條線(圖中的黑色實線),使Margin(虛線到黑色實線的距離)為最大,就是最好的線。Margin都為等長的。
w 我們稱為weight vector。只要讓Margin()最大,我們就稱之為好線!
而怎麼找呢?
公式如下:
for all i
接著解Quadratic programming problem,這些就請讀者們加油了,本篇只紀錄大概念。
SVM就是一種很厲害的分類器,可以將線性不可分的資料分類,但效能不太好。
機器學習-支撐向量機(support vector machine, SVM)詳細推導
[資料分析&機器學習] 第3.4講:支援向量機(Support Vector Machine)介紹