iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 26
0
AI & Data

索引結構與機器學習的相遇系列 第 26

Day 26 - Lognormal 分布測試

  • 分享至 

  • xImage
  •  

我前幾天針對不同的模型進行測試,神經網路模型擬合較佳,隨著神經元的數量增加,擬合狀況越好!
但是,每筆資料的CDF分布並不會像我們產生出來的分布這麼正規(如正常分布一樣),有些資料的分布可能相較不平均,我們今天要來產生 Lognormal 的CDF分布,建置不同的模型觀察其學習的測試結果。

Lognormal

指數正常分布,其CDF分布如下 :
https://ithelp.ithome.com.tw/upload/images/20201011/20129198moidW8g7eK.png

我們測試所建置的模型同昨天,Simple Linear Regression、NN,唯一不同的點在於我們訓練的NN模型參數有改變,epochs 為 100,lr 為 0.000001(手動調參XD)。
我們以mean=0,sigma=2產生Lognormal的資料,資料數量為1萬筆,產生的值再乘以1M。

程式碼在這 Code

Simple Linear Regression

https://ithelp.ithome.com.tw/upload/images/20201011/20129198QpfNAQoDdL.png

8x8 Neural Network

https://ithelp.ithome.com.tw/upload/images/20201011/20129198jErv8Vk5Cx.png

16x16 Neural Network

https://ithelp.ithome.com.tw/upload/images/20201011/20129198qhPpBEk7qj.png

32x32 Neural Network

https://ithelp.ithome.com.tw/upload/images/20201011/20129198oLjfzEgDAB.png

測試結果發現,奇怪8x8 or 16x16的NN模型還比32x32的好...為何XD
可能8x8的模型就足以學習這些資料了ㄅ ~
其實我們測試的資料數量還算很少,只有1萬筆,人家都馬幾百萬或幾千萬筆,我們明天會進一步實作真正的Learned Index,包含RMI架構!

先這樣嚕~~掰噗!
https://ithelp.ithome.com.tw/upload/images/20201011/20129198t2FUcskNQV.png


上一篇
Day 25 - 比較不同 Model 的測試
下一篇
Day 27 - Learned Index實作(1)
系列文
索引結構與機器學習的相遇30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言