Day 9 演算法選擇標準-2

2023 iThome 鐵人賽

DAY 9

AI & Data

15th鐵人賽

330 瀏覽

在此將分為兩個方面來分析:
①演算法準確度、穩定度的衡量
②依據特性來評估做選擇

模式錯誤的衡量

一個模型的誤差是兩者之合，常會有Trade off問題，有的模型會一方好一方壞(ex.深度學習)

偏差與方差示意圖:
左下方:Bias很大Variance很小
右上方:Variance很大Bias很小
右下方:兩者都很大

資料來源:https://jason-chen-1992.weebly.com/home/-bias-variance-tradeoff

特殊模式其只能精確、緊密的匹配訓練的樣本，以至於訓練完後，對於實際真正的樣本無法找到一個通用的法則來預測這些外部的樣本而產生許多預測錯誤，準確度降低的情況。
問題在樣本小、太過追求完美，使用上非常複雜，包含許多細節的模式來匹配預測樣本內的特殊特徵。
例子:學生死記模擬考題目沒有真正了解本質，碰到非模擬考題目就無法作答情況。
原因:
①樣本過少，所需要的特徵又過多
②訓練樣本只為母體中一小部分的特殊樣本，卻被誤認為真正的母體資料跟這些小樣本是一樣的
③誤認為小樣本內的特殊非一般性特徵(又稱噪音)是母體正確的、通用的特徵
解決:重新清洗資料、增加訓練樣本數量、採用捨棄法方法、增大正規項係數、使用早停法、增大學習率、增加雜訊資料、剪板
這個在機器學習常發生且非常致命的錯誤!
預防:
①各種交叉驗證，不斷變換訓練的樣本與測試的樣本
②增加樣本多樣性與數量
③降低模式複雜度