在本課中,我們將探索加密貨幣市場的獨特特性,並學習如何使用現代投資組合理論(MPT)來優化加密貨幣組合。我們還將深入探討優化算法,如蒙特卡洛模擬和遺傳算法,提供...
時差學習 Temporal difference learning link 時差學習是通過boottraping自助(link)從值函數的當前估計中進行學習。...
馬可夫決策過程 Markov decision process MDP 在概率論和統計學中,馬可夫決策過程(英語:Markov Decision Proce...