DAY 26 - 第二輪測試：風險指標最小化 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2017 iT 邦幫忙鐵人賽

DAY 26

自我挑戰組

類神經網路搭配啟發式演算法於時間序列之應用系列第 26 篇

DAY 26 - 第二輪測試：風險指標最小化

2017鐵人賽

Fat Finger ERR!

2017-01-10 22:57:38

4752 瀏覽

分享至

今天來到 DAY26 原先預定是要來探討風險指標最小化，距離鐵人賽結束時間也越來越近了，這段時間真的覺得非常不容易，讓我廢話一下哈哈，因為我原先沒有準備什麼內容，這次鐵人賽這要一輪下來讓自己內心有了一點架構，後續會再持續完成。

剩下幾天我想利用空閒把程式整理好給大家可以做個簡單的使用，那這幾天也因為工作關係來不及把程式碼完成，因此在此我就簡單來聊聊一些自己想說的吧。

對於資料的敏感度如何培養

這個問題是這樣的，很多朋友都有問過我說，我平日在開發類神經網路的演算法，尤其是這麼貼近金融市場這種和時間相關性非常強的資料，對於資料的敏感度有沒有一些 tricks 可以分享，我有一些自己的經驗，但套在大家身上不一定適用，一定要切記去對症下藥，但如果你真的沒什麼特別想法，或許我的一些看法能對你有幫助：

一、嘗試使用二進位編碼訓練資料

我知道很多朋友都蠻喜歡直接使用實際數值透過標準化之後直接灌到模型，這個想法基本上沒什麼問題，但是如果你轉成二進位編碼，去訓練有時候會得到一些意想不到的結果，但是注意最好資料維度不要太大，樣本數可以多一些。通常使用二進位編碼的資料做訓練，有時候誤差會非常大，所以也要準備好模型上線之後可能會突然得到一個不能用的預測值。

二、嘗試標準化到更小的區間，不只在 [0, 1] 而是到 [0, r] 的位置

這個主要是考量權重如果也是介在0,1之間的話，輸入資料會相對權重來說比較小，因此每一層神經網路的輸出值可能會依賴權重更多一些，會讓訓練的前期有更多的搜尋空間，或許對你會有幫助。RNN 模型使用這種更小的標準化有時候會有好處，因為你遞迴回來的隱藏層數值可能會是一個更彈性的數字，你可以透過加大最大訓練次數來嘗試看看更廣更深的訓練過程。

三、持續追蹤模型不要 one-off

還記得前面提到的真正例、負正例那些東西嗎？實務上我期盼大家都能使用這些指標去追蹤模型，但這就變成你必須要有個實際問題才能定義什麼是真假例、正負例，而這就是你培養資料敏感度的起點。透過清楚明白自己手上的類神經網路能與不能的界線，就會更容易地幫助你知道什麼時候你要重新訓練模型了。

好廢話結束哈哈，鐵人賽快支撐不下去，加油加油加油！！！哈哈