SVM - Soft Margin - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2018 iT 邦幫忙鐵人賽

DAY 23

AI & Machine Learning

機器學習你也可以 - 文組帶你手把手實做機器學習聖經系列第 23 篇

SVM - Soft Margin

2018鐵人賽

shortid

2018-01-10 13:56:59

6127 瀏覽

分享至

在hard margin的情況，其實就是我們不允許任何錯誤分類發生，這也是為什麼必須要在線性可分的情況下才能使用，不然永遠不會得到結果。而soft margin就是可以允許錯誤發生，那要怎麼樣允許錯誤發生呢？其實就是多導入一個slack variable

我們把這個條件

改成

那個怪怪的念 xi，xi 一定要大於等於零， xi 就是slack varialbe，他的值如下圖所示（圖片出自：PRML - p332）

也就是當正確的時候會是零，在邊界裡面但還是為的會小於一，錯誤開始就大於一。

接著我們把hard margin的這個最佳化問題

也加入slack variable，改成最小化下面這個式子

其中 C 是我們設定要懲罰那些犯錯的點的參數，C越大懲罰越重，而 C 到無限大的情況就會讓我們回到hard margin SVM。接著一樣利用Lagrange Multiplier的的方式寫下

接著分別對 w , b, xi微分，並且令為零，得最佳解條件

因為 mu 也是langrange乘數，所以非負，因此

一樣透過KKT condition得到兩個充要條件

因此我們的 a 會有三種狀況，分別會是

a = 0：分類正確的
0 < a < C：故 mu 大於零，因此 xi 是零，也就是這種資料會剛剛好在邊界上 (y = +- 1的位子)
a = C：xi > 0，這種資料會在邊界裡面以及錯誤分類的區域

後面兩種就是我們這邊的 support vector，我們這邊必須利用第二種support vector來計算 b。

所以我們這邊的SVM流程跟hard margin一樣

以smo算出 a ，便可得到 support vector兩種
利用0< a < C的那種support vector計算 b ，一樣利用昨天的式子算。
以為分類邊界（正負值對應二元分類）

這就是soft margin SVM的作法。

SVM - Hard Margin

SVM - Regression

系列文

機器學習你也可以 - 文組帶你手把手實做機器學習聖經共 30 篇

RSS系列文訂閱系列文

69 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19861 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

請推薦虛擬主機 VPS，及Apache SSL 設定

IT邦幫忙

機器學習你也可以 - 文組帶你手把手實做機器學習聖經系列 第 23 篇

SVM - Soft Margin

尚未有邦友留言

標記使用者

機器學習你也可以 - 文組帶你手把手實做機器學習聖經系列第 23 篇