iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 11
0

SVM-分分分

今天我們要來介紹SVM(Support Vector Machine)。

線性可分


假設現在我們要分類圓形還有正方形,那麼以這個例子來說,可以用很簡單的一根棍子來分類,這就是線性可分的。

線性不可分


那麼我們繼續分類圓形還有正方形,但現在有一個正方形跑到左邊了!我們的棍子不管怎麼擺放,都無法分割圓形還有正方形,那麼我們稱這個為線性不可分。

線性可分SVM

因為線性可分的圖形較為清楚,因此我們使用線性可分來解釋。
SVM是很厲害的人,可以把兩團資料做分類,而他是怎麼做到的呢?
SVM會找到一條線(圖中的黑色實線),使Margin(虛線到黑色實線的距離)為最大,就是最好的線。Margin都為等長的。

黑色的線該如何找?

w 我們稱為weight vector。只要讓Margin(https://chart.googleapis.com/chart?cht=tx&chl=2%2F%7Cw%7C)最大,我們就稱之為好線!

而怎麼找呢?
公式如下:
https://chart.googleapis.com/chart?cht=tx&chl=min_w%201%2F2w%5ETw
https://chart.googleapis.com/chart?cht=tx&chl=subject%20 https://chart.googleapis.com/chart?cht=tx&chl=to https://chart.googleapis.com/chart?cht=tx&chl=y_i(w%5ETx_i%2Bb)%3E%3D1 for all i
接著解Quadratic programming problem,這些就請讀者們加油了,本篇只紀錄大概念。

結論

SVM就是一種很厲害的分類器,可以將線性不可分的資料分類,但效能不太好。

參考資料

機器學習-支撐向量機(support vector machine, SVM)詳細推導
[資料分析&機器學習] 第3.4講:支援向量機(Support Vector Machine)介紹


上一篇
Day 10 DQN如何實現
下一篇
Day 12 Loss function到底損失了甚麼?
系列文
Machine Learning與軟工是否搞錯了什麼?30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言