iT邦幫忙

reinforcement learning相關文章
共有 10 則文章
Towards Tensorflow 2.0 系列 第 28

技術 [Day-28] 增強式學習 (Reinforcement learning) 介紹

今天我們來聊聊 增強式學習 (Reinforcement learning),一個最近也很 “潮” 的演算法。 自從 Alpha Go擊敗人類後開始,大家開始重...

鐵人賽 AI & Data DAY 25

技術 [魔法陣系列] Deep Q Network(DQN)之術式解析

「Deep Learning模型最近若干年的重要进展」一文提到深度學習分四個脈絡: CV/Tensor 生成模型 Sequence Learning Deep...

鐵人賽 AI & Data DAY 27

技術 [實戰系列] 使用 Keras 搭建一個 DQN 魔法陣(模型)

在理解 DQN 魔法陣的結構後,本篇來帶大家訓練 DQN 模型玩 Flappy Bird,引用參考的程式碼在此:https://github.com/yanpa...

Towards Tensorflow 2.0 系列 第 29

技術 [Day-29] 增強式學習 (DQN) - 股票操作

昨天已經簡單介紹了 RL、以及 DQN。今天我們來實作增強式學習中的 Deep Q Network 預測股票 (TSMC,俗稱 十萬青年十萬肝,GG輪班救台灣)...

AI 高中生的自我學習 系列 第 27

技術 Day 27 - 強化學習 Reinforcement Learning(1)

馬可夫決策過程 Markov decision process MDP 在概率論和統計學中,馬可夫決策過程(英語:Markov Decision Proce...

技術 安裝DEX

DEX也是香港中文大學發展的,它建立在SurRoL之上,跟SurRoL一樣,如果沒用dVRK硬體,不須裝dVRK.但他是用pytorch而非tensorflow...

AI 高中生的自我學習 系列 第 17

技術 Day 17 - 卷積神經網絡 CNN (2)- 戰國時代之版圖擴張

再看一次... 註:成功大學 連震杰教授 百家爭鳴 我們瞭解在1998 LeNet / 2012 AlexNet 之後,CNN相關技術及應用百家爭鳴1.Basi...

技術 安裝SurRoL

SurRoL conda create -n surrol python=3.7 -y conda activate surrol git clone htt...

鐵人賽 DevOps DAY 21

技術 [虛實整合]Unity Training Model with Python

在上篇文章提到Unity在train model使用的是Unity ML-Agents Toolkit,但我們之後會棄用,因為該Toolkit對於ML mode...

技術 dVRK在Unity上實作AR

dVRK在Unity上面的應用目前有2個,一個是dVRK-XR,另一個是UnityFlexML. 這都不用裝在Ubuntu上,也不用架dVRK,只要下載.zip...