累計文章數 17,823篇
參賽組數 926組
團隊組數 050隊
完賽人數 527 人
上一篇我們用 CartPole 了解如何實作 RL。今天來介紹自己的 RL project,更加深實作概念吧。 RL 非常適合應用在訓練遊戲 AI,而我在 St...
前面幾篇跟大家簡單介紹了在 MongoDB 進行 CRUD 相關操作的基本指令跟方法,今天則要介紹在 MongoDB 裡裡的資料有哪些資料型態。 綱要 S...
DQN如何實現 今天我們要用DQN來解The Taxi Problemcode參考這篇Reinforcement Learning: Deep Q-Networ...
量化交易30天本系列文章是紀錄一位量化交易新手的學習過程,除了基礎的Python語法不說明,其他金融相關的東西都會一步步地說明,希望讓更多想學習量化交易但是沒...
量化交易30天本系列文章是紀錄一位量化交易新手的學習過程,除了基礎的Python語法不說明,其他金融相關的東西都會一步步地說明,希望讓更多想學習量化交易但是沒...
前言 我們不一定會知道環境的Dynamic,昨天的Taxi環境gym好心提供給我們,但如果像是更複雜的環境,比如自駕車、21點、圍棋等等。如果要將所有機率算出來...