iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 8
1

前面幾天大致上介紹了關於Learned Index的概念與初步架構,如果前面的都忘了,或是沒有聽懂的地方,只要知道就是建置Model來取代傳統索引就好XD

沒有瞭解的同胞們,抱歉~不是你們的問題,就是我的問題(廢話XD),好啦~應該是我的表達能力有問題,請多多包容...QQ

廢話不多說,繼續亂寫文章 ! XD

Kraska et al. 對於Learned Index進行初步的測試,他們建置2層 32 x 32 的神經網路的模型,每個神經元的激勵函數使用ReLU。

https://ithelp.ithome.com.tw/upload/images/20200923/20129198IW3GufK1nN.png

他們所使用的資料為網頁系統200M筆的Log資料,阿就是2億筆資料,以timestamps為key值。

訓練的特徵即timestamps,標籤為pos ( =CDF(key) )。

套件使用Tensorflow,以Python語言調用 ~

訓練完後,針對Model進行look-up時間測試,隨機選取key值進行測試。

這裡所說的look-up時間測試是指Model預測的時間,也就是執行Model所花的時間,並不包括最後的查找 ( 預測錯誤後進行 binary search )。

https://ithelp.ithome.com.tw/upload/images/20200923/20129198pHP9o8gxQQ.png


上一篇
Day 7 - 不精準問題
下一篇
Day 9 - 初步測試 (2)
系列文
索引結構與機器學習的相遇30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言