上篇實戰前的測試路(一) :: 正規化資料實測了兩種正規化股市資料,分別是局部正規化
和漲跌幅正規化
。其中漲跌幅無論收斂速度或是圖形逼近實際程度都優於局部正規化方法,但充其量只是一隻「模仿貓」, 短線參考沒有意義、卻又無法預測長線資料 。在該篇最後提出可以將兩這結合,但結合之前我還想多做一個測試。
加入 成交量 資訊
我認為這應該也是一個影響因素,所以今天我會針對這個新加入的資訊重新測試不同正規化的結果。
0-35
)漲跌幅
資訊可以發現紅色
的資訊其實根本不重要,它大概就是個帶有突波的雜訊,果斷遺棄。藍色
或許是我們要的,就拿它來開刀吧!
我認為成交量資訊是一個可以看「global」的資料,曾經的歷史最高成交紀錄如果再次出現,那麼很有可能代表某些未來可以被預測。基於此,我對成交量的正規化方式與Open資訊不同,採用全域正規
的方式
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
lstm (LSTM) (None, 60, 50) 10600
_________________________________________________________________
lstm_1 (LSTM) (None, 60, 50) 20200
_________________________________________________________________
flatten (Flatten) (None, 3000) 0
_________________________________________________________________
dense (Dense) (None, 128) 384128
_________________________________________________________________
dense_1 (Dense) (None, 40) 5160
_________________________________________________________________
dense_2 (Dense) (None, 1) 41
=================================================================
Total params: 420,129
Trainable params: 420,129
Non-trainable params: 0
_________________________________________________________________
正規化方法 | 輸入天數 | Loss | 輸出結果 |
---|---|---|---|
局部正規 | 60 | ||
局部正規 | 30 | ||
局部正規 | 10 | ||
局部正規 | 5 | ||
漲跌幅 | 60 | ||
漲跌幅 | 30 | ||
漲跌幅 | 10 |
正規化方法 | 輸入天數 | Loss | 輸出結果 | 備註 |
---|---|---|---|---|
局部正規 | 5 | batch:200、epoch:1500、epoch_choose:600 | ||
局部正規 | 60 | batch:200、epoch:500 | ||
局部正規 | 6 | batch:5、epoch:100 |
其實會發現,無論怎麼調整都無法達到「預測」這一目的,使用「局部正規」的方法還算是擁有自己的意志 (這什麼說法?
然而股票的參數當然不只如此,股票的指標共有60種有餘,我們只用了其中兩種。不過這些指標很多等於是對股票特徵提取,近幾天的測試內容還是希望在「沒提示」的情況下繼續進行~
下一測 :: 最後一次的資料正規化測試