矮子能看得更遠,只因為他站在巨人的肩膀上。 - Isaac Newton
今天的文章,我將著眼於過去研究,探討之前的研究人員,在股市預測下應用了哪些方法,來作為之後文章方向的參考。
本篇文章主要參考「人工智能應用於股票市場交易(Artificial Intelligence Applied to Stock Market Trading: A Review)」,若是論文中已有片段,我會直接利用引用功能來擷取。
一般來說,人工智能被應用於金融的三個不同領域:投資最佳化,股市預測,以及市場情緒分析。儘管每個領域都有差異和特殊性,但一些作品提出了不同領域的技術組合。計算金融領域的其他一些研究包括應用於金融市場的動態系統控制(Dynamic Systems and Control)、投資人行為分析(Investor Behavioral Analysis)、網絡分析(Network Analysis)和金融產品的聚類分類(Clustering of Financial Assets)。
投資組合優化,是確定一個或一組最適合特定投資者的資產組成的問題,通常以投資組合優化為目標。
根據這個命題,目前最常使用的方法是現代投資組合理論(Modern Portfolio Theory),或者轉換成一般人聽得懂的說法 - 雞蛋不要放在同一個籃子。
現代投資組合理論假定投資者為規避風險(Risk Averse)的投資者。如果兩個資產擁有相同預期回報,投資者會選擇其中風險小的那一個。只有在獲得更高預期回報的前提下,投資者才會承擔更大風險。換句話說,如果一個投資者想要獲取更大回報,他(她)就必須接受更大的風險。一個理性投資者會在幾個擁有相同預期回報的投資組合中間選擇其中風險最小的那一個投資組合。另一種情況是如果幾個投資組合擁有相同的投資風險,投資者會選擇預期回報最高的那一個。這樣的投資組合被稱為最佳投資組合(Efficient Portfolio)。 - from Wikipedia
看不懂? 沒關係,因為我也看不懂,根據另外查的資料可以解釋成不那麼數學的說法。
風險又可分為兩種:
Markowitz利用數學向我們證明了,非系統性風險是可以透過多元投資來規避的,在此種環境下,個股的風險對投資組合風險貢獻很小,取而代之的是由各股票風險水平之間的差異決定,因此投資者能從持有多元化的投資組合獲益。
雞蛋不能放在同個籃子,投資越多元,風險越低
Image by Julie Bang © Investopedia 2020
而有效邊界 (Efficient frontier)則代表著,在同樣風險的情況下,必定有一種投資組合有最佳報酬。
可樂的風險比Google低,相對的投資報酬率也較低,而線段以下的部分則好比是附近快要倒的家庭工廠
Image by Julie Bang © Investopedia 2020
在投資最佳化這塊,AI主要用於各個參數的調整,方法從過去的啟發式(heuristic)優化,到現在的基因優化與機器學習。
投資組合理論要求各個投資之間關連性越低越好,並且沒有考慮到市場情緒(Financial Sentiment)的問題,但是各個股票之間的實際上是會互相牽扯的,甚至連期貨這種過去被認為與股票關係不大的投資,近年研究也表明關係遠比過去人們認為的還大,市場情緒影響股價也已被證明是存在的。
股市預測(Stock Market Prediction)最簡單的定義:基於過去資料,來預測明天的股票價格。
總算不用對著一頁數學公式瞪眼10分鐘了
根據資料使用的不同,又可分為兩大類:
利用AI模型金融預測流程圖
基於預測對象與實作方法又分為:
為了預測資產價格及其趨勢,文獻中的絕大多數方法都採用機器學習技術。回歸技術通常用於價格預測,分類技術通常用於預測資產價格變動的趨勢。越來越多的數據被用作輸入或特徵,意味著需要用方法來選擇和預處理這些輸入數據,過濾最基本的信息。深度學習方法是另一個趨勢,在最近的工作中顯示出有希望的結果,儘管它有顯著的計算複雜性,這使得數據選擇和預處理變得更加重要。
關於使用資產歷史數據的預測,機器學習方法最近被越來越多地使用。具體來說,深度學習方法大幅增加,產生了令人鼓舞的結果。同時,在不同的作品中使用的特徵有很大差異,包括技術和基本面指標。然而,在分析這些特徵對方法性能的貢獻方面,研究有限。
情感分析是分析人們對某一實體(如產品)的感受和情緒的研究領域,以評估這些意見是負面的還是正面的,以及它們的負面或正面程度。要進行情感分析,首先需要收集大量的文本,如從社交媒體或新聞網站中提取的、用自然語言寫成的文本。因此,應用自然語言處理方法也是必要的。情感分析已經被越來越多地應用於多個知識領域,如計算金融。
在金融領域,一些研究人員測試了新聞和意見對未來資產價格的影響,檢查了效率市場假說,其基礎是新聞和意見引導投資者,創造市場價格的趨勢,從而為投資者在股票市場交易中獲得利潤提供可能性。
值得注意的是,第一批應用於金融領域的情感分析工作是使用新聞作為輸入數據。然而,現在有一種趨勢是使用社交網路上的評論,這大大增加了數據的總規模。因此,對這些數據進行預處理並選擇最重要的資訊成為這種方法的必要任務。應用於金融投資的情感分析在實踐中通常用於決定是否購買或出售所研究的資產,因此,經常與這些資產的歷史價格分析相結合。在這種結合中,預測的情緒被用作機器學習算法的特徵之一來預測資產的價格或運動趨勢。
第一批應用於金融投資的情感分析工作採用了新聞作為研究對象。由於社交網絡的普及,互聯網上出現了大量關於金融資產及其公司的評論,這也成為這類分析中最常用的信息來源。然而,很少有論文同時考慮使用這兩個來源(新聞和社交網絡上的評論)。
組合型論文整合了討論的兩種或更多的方法,通常旨在提高機器學習模型的性能或增加股票市場中交易模擬提供的利潤。雖然絕大多數論文只使用了一種方法,但許多文章指出了更好的組合方法,這些都是比較新的作品。
最後,論文中提出的各種方法的組合顯示出相比單一方法的優越性,儘管文獻中的組合論文數量仍然很少。
看到這裡你可能已經看出來了,由於該篇論文是整合型的論文,因此後面技術部分不多的部分基本上我都直接全部引用了。
完全不用管引用比例的感覺真爽
之後的幾天內,我會參考幾個比較重要的論文,以台灣股票的資料實作一遍,可能是SVM、XGBoost等簡單易用的模型,也可能先清理資料,詳細情況就明天再說了,畢竟我的存稿也沒了。