前面幾天大致上介紹了關於Learned Index的概念與初步架構,如果前面的都忘了,或是沒有聽懂的地方,只要知道就是建置Model來取代傳統索引就好XD
沒有瞭解的同胞們,抱歉~不是你們的問題,就是我的問題(廢話XD),好啦~應該是我的表達能力有問題,請多多包容...QQ
廢話不多說,繼續亂寫文章 ! XD
Kraska et al. 對於Learned Index進行初步的測試,他們建置2層 32 x 32 的神經網路的模型,每個神經元的激勵函數使用ReLU。
他們所使用的資料為網頁系統200M筆的Log資料,阿就是2億筆資料,以timestamps為key值。
訓練的特徵即timestamps,標籤為pos ( =CDF(key) )。
套件使用Tensorflow,以Python語言調用 ~
訓練完後,針對Model進行look-up時間測試,隨機選取key值進行測試。
這裡所說的look-up時間測試是指Model預測的時間,也就是執行Model所花的時間,並不包括最後的查找 ( 預測錯誤後進行 binary search )。