累計文章數 17,823篇
參賽組數 926組
團隊組數 050隊
完賽人數 527 人
上一篇我們用 CartPole 了解如何實作 RL。今天來介紹自己的 RL project,更加深實作概念吧。 RL 非常適合應用在訓練遊戲 AI,而我在 St...
前言 我們不一定會知道環境的Dynamic,昨天的Taxi環境gym好心提供給我們,但如果像是更複雜的環境,比如自駕車、21點、圍棋等等。如果要將所有機率算出來...
前言 昨天我們用-greedy來當作我們的目標policy,並用同樣的policy來與環境互動,這樣跟我們的目標好像有點衝突,一邊要學習optimal poli...
量化交易30天本系列文章是紀錄一位量化交易新手的學習過程,除了基礎的Python語法不說明,其他金融相關的東西都會一步步地說明,希望讓更多想學習量化交易但是沒...
Oracle Database主要由實體檔案與記憶體結構配置組合而成的。 可以參考下圖: 介紹Oracle Database的Process PMON(Pro...
如果你經歷過 2016 年,且對圍棋或 AI 稍有研究,那你肯定聽過 AlphaGo 的偉大事蹟 —— 在和世界頂尖圍棋高手李世石的五盤較量中,AlphaGo...