Day 23 使用合成數據回測(上)

2023 iThome 鐵人賽

DAY 23

AI & Data

從零到英雄：用GCP建立AI交易體系系列第 23 篇

15th鐵人賽

wu850206

2023-10-05 15:29:33

753 瀏覽

分享至

一樣數學式的部分是這篇文章的截圖可以進來看

上一篇提到了組合式清除交叉驗證(CPCV)的回測方法，我們就擁有兩種回測方案了一個是WF一個是CPCV。

今天要介紹一種少見但是十分有效也有趣的回測方案：

合成數據回測

這個方法使用歷史數據來生成一個具有從觀察到數據估算出統計特性產生的合成數據集。這將使我們能夠在大量未見過的、合成的測試集上回測一個策略，因此減少該策略已經適配到一個特定數據集合而過擬合的可能性。

交易規則

投資策略可以被定義為假設市場效率不足存在的算法。有些策略依賴於計量經濟學模型來預測價格，使用宏觀經濟變量如GDP或通膨；其他策略使用基本面和財報資料來定價證券，或在衍生性金融商品中尋找套利的機會等。例如，假設金融機構傾向於在美國財政部拍賣前兩天賣出非當期的債券，以籌集購買新「紙張」所需的現金。人們可以通過在拍賣前三天賣出非當期債券來做空賺錢。但如何做呢？每一個投資策略都需要一個實施手法，通常被稱為「交易規則」。

市場上面有數十種對沖基金風格，每種風格都有數十種獨特的投資策略。雖然策略在性質上可以非常多樣化，手法相對來說是一致的。交易規則提供了必須遵循以買進和賣出一個部位的算法。例如，當策略的信號達到某一特定值時，將買進一個部位。賣出部位的條件通常通過獲利和停損的閥值來定義。這些買進和賣出規則依賴於通過歷史模擬來校準的參數。這種做法導致了嚴重的回測過擬合的問題，因為這些參數針對樣本內的特定觀察值，以至於投資策略過於依賴過去，而不適用於未來。

有一點很重要的澄清，我們有興趣的是最大化績效的賣出條件。換句話說，部位已經存在，問題是如何最優地賣出它。這是執行交易者經常面臨的兩難，不應該與投資於一種證券的買進和賣出閾值的確定混淆。

雖然評估回測過擬合的概率是一個有用的工具來剔除多餘的投資策略，但最好還是盡量避免過擬合的風險，至少在校準交易規則的中是這樣。理論上這可以通過直接從生成數據的隨機過程(很多金融論文都提到，也可以看維那過程)中導出交易規則的最優參數來實現，而不是參與歷史模擬。這是我們在這裡採取的方法。使用整個歷史樣本，我們將描述生成觀察到的收益流的隨機過程，並在不需要歷史模擬的情況下導出交易規則的參數的最優值。