iT邦幫忙

2024 iThome 鐵人賽

DAY 11
0
AI/ ML & Data

從投信數據預測葛蘭碧突破後股價走勢系列 第 11

[Day 11] 從零開始建立一個基於LSTM的投信介入後股價預測系統

  • 分享至 

  • xImage
  •  

https://ithelp.ithome.com.tw/upload/images/20240925/20169373uBPdWzFDxq.png

前言

在經過了前幾篇文章的鋪陳,我們已經了解了LSTM的基本運作原理,也學會了怎麼從API抓取所需的資料。不管是投信數據、葛蘭碧突破訊號,還是均線的挑選,這些都為我們即將打造的預測系統做好了準備。接下來,就要把這些知識串聯起來,正式開始構建一個能預測投信介入後股價走勢的LSTM模型。接下來我會按照章節的形式,分享我未來的規劃方向:

章節概述

章節 1:資料收集與準備

  • 資料來源選擇:如何從公開數據平台如台灣證交所、Yahoo Finance、FinMind API等收集股價歷史數據與投信買賣資料。
  • 資料清理:包括缺失值處理、日期對齊、去除異常值,確保資料一致性。
  • 特徵選擇:哪些特徵(如投信買入量、交易量、最高價、最低價、收盤價等)對股價預測最為重要。
  • 資料標籤:將股價未來走勢定義為模型的預測目標,並根據投信介入時間標記關鍵數據。

章節 2:數據預處理與特徵工程

  • 時間序列資料的處理方式:如何將股價和投信介入數據轉換為適合LSTM模型的時間序列格式。
  • 標準化與正規化:LSTM對於數據尺度敏感,因此需要將數據進行標準化處理。
  • 生成訓練集和測試集:如何合理地將歷史數據切分成訓練集和測試集,並確保數據的時間連續性。

章節 3:搭建LSTM模型

  • LSTM模型的架構:介紹LSTM的原理和其在處理時間序列數據中的優勢。
  • 模型參數設定:選擇合適的層數、單元數、激活函數等模型超參數。
  • 模型編譯與優化:如何選擇損失函數(如MSE)和優化器(如Adam),並進行模型編譯。

章節 4:模型訓練與驗證

  • 模型訓練:如何設定訓練批次大小(batch size)、訓練週期數(epochs),並在數據上訓練LSTM模型。
  • 模型評估:介紹各種評估指標(如RMSE、MAE、MSE),並在測試數據上進行模型驗證。
  • 模型調參:根據模型的預測結果調整模型參數以提升預測精度,並防止過擬合。

章節 5:模型應用與未來優化

  • 模型部署:如何將訓練好的模型部署在實際系統中,實時預測投信介入後股價走勢。
  • 未來優化方向:基於LSTM模型進行擴展,如結合技術指標、社會情緒分析等,進一步提升模型的預測能力。

結語

本篇我們說明了從資料收集到LSTM模型部署的流程,帶大家一步步建立一個專門用來預測投信介入後股價走勢的系統。接下來,我們會在後續的文章中深入探討每個章節的技術細節和實作過程,讓大家能更容易上手並靈活應用LSTM模型來進行股價預測。


上一篇
[Day 10] RNN/LSTM? (3)
下一篇
[Day 12] 資料收集與準備-資料來源
系列文
從投信數據預測葛蘭碧突破後股價走勢12
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言