[Day 18] Regularization - Sparsity - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2019 iT 邦幫忙鐵人賽

DAY 18

AI & Data

跟著Google學ML系列第 18 篇

[Day 18] Regularization - Sparsity

2019鐵人賽 machine learning

Joseph-bug

2018-10-18 22:55:18

4181 瀏覽

分享至

Ref.: Regularization for Sparsity

Regularization在 Day 14時說過L_2 Regularization，再回想一下我們在Day 13 特徵組合的時候，有個很簡單的例子兩種gender、height 3個group，height_x_gneder就有2 * 3 = 6種組合。如果1,000 * 10,000呢？就有10,000,000這麼多種組合，之中又有多少是沒用的feature呢？這種高維度的特徵向量(high-dimensional feature vector)會讓model size很大，而且RAM也會消耗很多。

我們應該減少沒有用的feature，讓他們的weight = 0，以減少RAM的cost。很不巧L_2 Regularization實在沒辦法，只能讓weight變得很小很小，沒用的feature還是會浪費RAM的空間。

聽起來，Regularization term取non-zero的weight的數量，是不是可以讓weight=0的feature沒用？而且model有足夠能力fit data時增加它才合理。這稱作L_0 Regularization，但很可惜這個方法是NP-hard的問題，像是背包問題，很難優化。

還好還有個L_1 Regularization，跟L_0類似，很鼓勵沒訊息的係數設定為0，以減少記憶體使用量。快來比較一下L1 跟 L2吧