Day4-L1、L2 regularization & Elastic net - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2023 iThome 鐵人賽

DAY 4

1

AI & Data

什麼演算法?一起來學機器學習!系列第 4 篇

Day4-L1、L2 regularization & Elastic net

15th鐵人賽機器學習 lasso ridge 學習筆記

團隊好想放假大學

2023-09-19 15:19:36

593 瀏覽

分享至

正規化可減少模型overfitting的問題

L1 regularization (Lasso)

加入L1正規化 (loss function + L1 regularization)
get gradient 對w做偏微
- w > 0, 結果為1 ; w < 0, 結果為-1 ; w = 0, 結果為0
- sgn(x) 判斷實數正負號
每次更新
- learning rate 通常是正的
- 正規化係數通常也是正的
- 如果 sgn(w) = 1 -> w ↓
- 如果 sgn(w) = -1 -> w ↑

L2 regularization (Ridge)

加入L2正規化 (loss function + L2 regularization)
get gradient 對w做偏微 (我手寫的見諒)
- 關於為甚麼有1/2 (與2做消除)
每次更新
- learning rate 通常是正的
- 正規化係數通常也是正的
- 1 - learning rate * regularization coefficient < 1
  -> w ↓ (原w越大，計算後改變越多)

Lasso & Ridge

lasso
- 不論參數大小，下降速度一致
- 結果會有接近0的，也會有很大的值
ridge
- 參數大，下降較快; 參數小，下降較慢
- 結果會保留很多很小的值

Elastic net

loss function + L1 regularization + L2 regularization
- lasso 下降速度不一致，可能導至相關性高的不同變數僅保留一部分(會執行變數挑選)
- ridge 產生多個很小的值，w會一起下降(皆降低)
總結: Elastic Net綜合了Ridge 的正規化以及Lasso 的變數挑選

參考資料

https://www.youtube.com/playlist?list=PLJV_el3uVTsPy9oCRY30oBPNLCo89yu49
https://reurl.cc/GKbZl3 (Elastic圖片來源)

Day3-線性回歸 (Linear Regression)

Day5-線性回歸(Linear Regression)與L1、L2 regularization & Elastic net實作 + jupyter notebook路徑&瀏覽器設定教學

系列文

什麼演算法?一起來學機器學習! 共 30 篇

目錄

RSS系列文訂閱系列文

6 人訂閱

完整目錄

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22211 篇

完賽人數

600 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js