今天我們來聊聊 增強式學習 (Reinforcement learning),一個最近也很 “潮” 的演算法。 自從 Alpha Go擊敗人類後開始,大家開始重...
「Deep Learning模型最近若干年的重要进展」一文提到深度學習分四個脈絡: CV/Tensor 生成模型 Sequence Learning Deep...
在理解 DQN 魔法陣的結構後,本篇來帶大家訓練 DQN 模型玩 Flappy Bird,引用參考的程式碼在此:https://github.com/yanpa...
昨天已經簡單介紹了 RL、以及 DQN。今天我們來實作增強式學習中的 Deep Q Network 預測股票 (TSMC,俗稱 十萬青年十萬肝,GG輪班救台灣)...
馬可夫決策過程 Markov decision process MDP 在概率論和統計學中,馬可夫決策過程(英語:Markov Decision Proce...
DEX也是香港中文大學發展的,它建立在SurRoL之上,跟SurRoL一樣,如果沒用dVRK硬體,不須裝dVRK.但他是用pytorch而非tensorflow...
再看一次... 註:成功大學 連震杰教授 百家爭鳴 我們瞭解在1998 LeNet / 2012 AlexNet 之後,CNN相關技術及應用百家爭鳴1.Basi...
SurRoL conda create -n surrol python=3.7 -y conda activate surrol git clone htt...
在上篇文章提到Unity在train model使用的是Unity ML-Agents Toolkit,但我們之後會棄用,因為該Toolkit對於ML mode...
dVRK在Unity上面的應用目前有2個,一個是dVRK-XR,另一個是UnityFlexML. 這都不用裝在Ubuntu上,也不用架dVRK,只要下載.zip...