金融、技術和資料分析長期以來一直共生。
深度學習常被被用於客戶行銷,預測行為、流失、流失率和對廣告的反應。
對沖基金、高頻交易和資產管理平台用來生成智能貝塔(Smart Beta)投資因子,預測借貸和融資利息。
NLP 的深度學習子領域改變了客戶界面和交互。
監管機構檢測系統級市場操縱和洗錢行為,實現模型風險管理監督的自動化。
超維性
維數災難(Curse of dimensionality):
維數的增加,特徵空間體積爆發,可用資料稀疏分佈,通過計算來找出全域最小值變得不可能。
超維性使得探索全局最小值變得更加困難和計算成本高昂,還導致模型過度擬合和不穩定問題。
非線性
萬能逼近定理(Universal Approximation Theorem):
每個節點都有稱為激活函數的非線性函數,增加了複雜性以及對資料過度擬合預測結果的可能。
正則化(Regularization)對模型應用約束避免過度擬合的過程解決了問題,但也降低了準確性。
非決定性
大多數統計分析工具,應用於資料集的建模技術將是確定性的,每次訓練都會產生相同的模型。
優化過程中依賴隨機元素,當一個輸出作為輸入到另一個神經網路時,就會出現另一個不確定性。
動態性
持續學習(Continual Learning):
某些深度學習設計為動態的,根據最新的資料和反饋重新優化參數、調整決策算法並自動部署到生產決策系統的模型能夠以更高的精度進行預測。
複雜性
金融機構通過將數百個內部模型的決策和預測聯繫在一起,加劇了日益增加的複雜性。
這些模型可以直接相互反饋,或者可以使用其他模型的觀察來調整它們的行為。
有限解釋性
可解釋性通常涵蓋了模型的決策和結果可以向客戶、管理層和監管機構解釋的概念。
LIME、SHAP 和 ELI-5 等可解釋人工智能技術目的在了解模型的原理,但它們的能力都有限。
缺乏公平性
公平是金融包容性、經濟機會、個人尊嚴、社會凝聚力和對金融體系信任的關鍵。
深度學習模型尚未完全出現應對偏見挑戰的技術和監管方法。
缺乏穩健性
神經網路從資料集中提取潛在特徵的能力是令人難以置信的預測能力的來源。
這些潛在輸入特徵的分析可能會導致顯著不同的高置信度模型預測和解釋後來被認為是不正確的。
深度學習對資料的永不滿足的需求。
隨著訓練資料集大小的增加,深度學習的準確性按照冪律增加。