累計文章數 17,823篇
參賽組數 926組
團隊組數 050隊
完賽人數 527 人
上一篇我們用 CartPole 了解如何實作 RL。今天來介紹自己的 RL project,更加深實作概念吧。 RL 非常適合應用在訓練遊戲 AI,而我在 St...
前面幾篇跟大家簡單介紹了在 MongoDB 進行 CRUD 相關操作的基本指令跟方法,今天則要介紹在 MongoDB 裡裡的資料有哪些資料型態。 綱要 S...
DQN如何實現 今天我們要用DQN來解The Taxi Problemcode參考這篇Reinforcement Learning: Deep Q-Networ...
以下文章已於 2021/09/16 轉移至 微笑之家對於discord.js更新,或是有其他問題,都歡迎到以下網址查看喔本站本主題本文章 在今天的文章開始前,...
量化交易30天本系列文章是紀錄一位量化交易新手的學習過程,除了基礎的Python語法不說明,其他金融相關的東西都會一步步地說明,希望讓更多想學習量化交易但是沒...
前言 我們不一定會知道環境的Dynamic,昨天的Taxi環境gym好心提供給我們,但如果像是更複雜的環境,比如自駕車、21點、圍棋等等。如果要將所有機率算出來...