iT邦幫忙

2023 iThome 鐵人賽

DAY 22
0
AI & Data

從零到英雄:用GCP建立AI交易體系系列 第 22

Day 22 詳細的交叉驗證回測討論_CPCV組合式清洗交叉驗證法(下)

  • 分享至 

  • xImage
  •  

因為數學式沒辦法顯示只能用截圖的就麻煩大家體諒了

完整文章



如何用組合式淨化交叉驗證 (CPCV) 避免回測過度擬合

如果你有一堆隨機數字,這些數字基本上是常態分布的(也就是說,大部分數字集中在中間),你可以用一個數學公式來估算這些數字中最多的一個大概是多少。這在數學和金融領域有很多應用。

現在,假設有個研究人員在市場上測了很多策略。即使這些策略實際上沒有真正的優勢(也就是說,他們表現得像隨機數字),我們還是會發現一個看似表現很好的策略。

通常的回測方式(WF回測)有個問題:它會過度依賴少數幾個數據點,導致結果非常不穩定。這會讓研究人員選擇錯誤的最佳策略,即使那個策略實際上並不優越。

因此,我們需要更好的模型評估方法,像是FWER、偽陽性率(FDR)和回測過度擬合機率(PBO),強烈建議要看一下這幾個連結討論。

交叉驗證(CV回測)嘗試解決這個問題,它會在多個數據集上訓練和測試策略。但這還不夠,因為它仍然只從一條“路徑”(也就是一組特定的數據)來評估每個策略。

這就是組合式淨化交叉驗證(CPCV)派上用場的地方。它不僅僅從一條路徑來評估,而是考慮多條路徑,從而更全面地了解策略的表現。

CPCV的優點是它會減少錯誤地選擇表面上好但實際上不好的策略的風險。當你有足夠多的“路徑”或數據集時,CPCV能讓你更準確地估計一個策略的真實表現。

研究或評估投資策略,使用CPCV會是一個好主意,因為它可以幫你更準確地找出真正有用的策略,並避免因為過度擬合而做出錯誤的選擇。

這樣,我們就能減少不準確結果。這對解決回測過度擬合,也就是金融統計學中最重要的未解問題,具有重要意義。

完整文章


上一篇
Day 21 詳細的交叉驗證回測討論_CPCV組合式清洗交叉驗證法(上)
下一篇
Day 23 使用合成數據回測(上)
系列文
從零到英雄:用GCP建立AI交易體系34
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言