~今天要分享的是「支持向量機介紹」~
支持向量機又稱為SVM,它是一種監督式機器學習方式,可用於解決迴歸跟分類的問題,用於迴歸稱做SVM-R(Regression),用於分類則稱為SVM-C(Classification)。
當欲分析的資料具有多個變數(高維數據)時,並不容易找到一個可以有效區分數據的函數,而SVM的核心概念是將數據投射到一個平面上,這個平面在二維空間是一條直線,SVM會計算每個樣本距離這條線的距離,目的是找到一條線與這些樣本有著最大的邊距(稱為Margin),讓SVM可以有效的區分資料。
[考試愛考觀念]
懲罰參數(標記為C):用於防止模型過擬合。如果參數C的值越大,就越容易導致模型過擬合,因為可容忍的間距會變窄;如果參數C的值越小,則越容易導致模型欠擬合,因為可容忍的間距會變寬。
也就是說,當過擬合時,降低參數C的值;當欠擬合時,增加參數C的值。
“硬邊距”與”軟邊距”
硬邊距:邊距不能改變,不能容忍分類錯誤
軟邊距:邊距可以透過調整參數C改變,可以容忍分類錯誤