iT邦幫忙

2021 iThome 鐵人賽

DAY 7
0
AI & Data

從零開始的套牢生活 - AI股票預測系統系列 第 7

[Day 7] 從零開始的股票預測 - 異常值偵測

  • 分享至 

  • xImage
  •  

一、異常值(Outliers)

異常值是指某些大幅度偏離正常值的資料點,來源可能是測量異常或記錄異常
由於該值容易導致模型偏離正常值的預測,因此濾除異常值通常是進行資料分析的第一步
https://ithelp.ithome.com.tw/upload/images/20210912/20141586M0DUbjs4rz.png
紅點即為異常值 from [1]

二、高槓桿觀察值(High Leverage Observations)

高槓桿觀察值類似異常值,但通常對模型訓練有極大的正面影響,也就是有高槓桿值(high leverage)
https://ithelp.ithome.com.tw/upload/images/20210912/20141586TwA3dekADK.png
紅點雖遠離正常值,但因其高槓桿值而不須被濾除 from [1]

三、股市資料的異常值

然而尷尬的是,股市由於波動起伏大,容易把高槓桿觀察值辨識為異常值
除非是差距真的十分龐大(一天價格差距2倍之類的),
否則異常值偵測可以說沒多大意義

四、實作

由上所述,所以程式碼看看就好,
基本上我把程式寫完才想到上述問題,
如果我之後問/想到另外解法再改文章

沒錯,我又挖坑了

參考


上一篇
[Day 6] 從零開始的股票預測 - 準備資料
下一篇
[Day 8] 從零開始的股票預測 - 技術指標與相關係數
系列文
從零開始的套牢生活 - AI股票預測系統30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言