我前幾天針對不同的模型進行測試,神經網路模型擬合較佳,隨著神經元的數量增加,擬合狀況越好!
但是,每筆資料的CDF分布並不會像我們產生出來的分布這麼正規(如正常分布一樣),有些資料的分布可能相較不平均,我們今天要來產生 Lognormal 的CDF分布,建置不同的模型觀察其學習的測試結果。
指數正常分布,其CDF分布如下 :
我們測試所建置的模型同昨天,Simple Linear Regression、NN,唯一不同的點在於我們訓練的NN模型參數有改變,epochs 為 100,lr 為 0.000001(手動調參XD)。
我們以mean=0,sigma=2產生Lognormal的資料,資料數量為1萬筆,產生的值再乘以1M。
程式碼在這 Code
測試結果發現,奇怪8x8 or 16x16的NN模型還比32x32的好...為何XD
可能8x8的模型就足以學習這些資料了ㄅ ~
其實我們測試的資料數量還算很少,只有1萬筆,人家都馬幾百萬或幾千萬筆,我們明天會進一步實作真正的Learned Index,包含RMI架構!
先這樣嚕~~掰噗!