iT邦幫忙

平滑化相關文章
共有 2 則文章
鐵人賽 AI & Data DAY 26

技術 Day 26: N-Gram Smoothing 平滑方法

Day 24時結尾提到幾個存在的問題:「(1) 當文集資料量變大時,每個東西出現的機率會將得非常低,所得到的最終機率也會非常低;(2) 若是有個東西出現在文集的...

鐵人賽 AI & Data DAY 17

技術 Day17 Categorical Data 1/2 mean encoding 類別型特徵 1/2 均值編碼

除了Day03討論過的獨熱編碼與標籤編碼兩種基礎編碼方式,均值編碼也是另一種類別型特徵常用的編碼方式。一般處理類別型特徵預設採用標籤編碼,除非該特徵重要性高,且...