iT邦幫忙

2021 iThome 鐵人賽

DAY 12
0
AI & Data

從零開始的套牢生活 - AI股票預測系統系列 第 12

[Day 12] 當沖實驗結果概述

一、總結

總結來說,今天研究了一整天論文
該篇論文對蒐集5分線數據,並以此預測之後的股價傾向,

與論文不同的是我使用的不是5分K線,而是日k線
目前確定了幾條結論:

  • 確認了股市資料的時間關聯性
    • 1.將觀察的歷史天數拉長可以提高準確率,雖然過久的歷史容易失焦導致準確率再次下降
    • 2.以每日股價的差額而非股價本身作為特徵能使準確率略微上升,
  • 高頻市場(當沖)與長線預測可能有極大的差異,以至於當沖預測方法在長線預測失效
    • 論文預測機率為60% ~ 75%
  • 機器學習方法普遍有嚴重過擬合問題
    • Test loss完全沒有下降的傾向,代表模型嚴重過擬合
    • 確認了不是train與test資料差異性造成
    • 確認了不是特徵過多造成
    • 確認了不是模型或調參問題
    • https://ithelp.ithome.com.tw/upload/images/20210917/201415860iiLRrkBUm.png

二、看不懂?

看不懂正常,因為我純粹把這篇當成技術筆記(X
明天我會將FinMind的Ticker資料轉成5分線資料,如果還是沒結果,
那代表傳統機器學習方法用來預測股票可能有先天性不足,
後天就會提前進入深度學習領域

非常亂的程式碼

絕對不會少的每日油圖

https://i.imgur.com/dfbUEzG.png
From 嘎唄


上一篇
[Day 11] 來自未來的資料 - 數據泄露(Data leakage)
下一篇
[Day 13]
系列文
從零開始的套牢生活 - AI股票預測系統30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言