iT邦幫忙

reinforcement learning相關文章
共有 6 則文章
AI 高中生的自我學習 系列 第 27

技術 Day 27 - 強化學習 Reinforcement Learning(1)

馬可夫決策過程 Markov decision process MDP 在概率論和統計學中,馬可夫決策過程(英語:Markov Decision Proce...

AI 高中生的自我學習 系列 第 17

技術 Day 17 - 卷積神經網絡 CNN (2)- 戰國時代之版圖擴張

再看一次... 註:成功大學 連震杰教授 百家爭鳴 我們瞭解在1998 LeNet / 2012 AlexNet 之後,CNN相關技術及應用百家爭鳴 1.Ba...

Towards Tensorflow 2.0 系列 第 29

技術 [Day-29] 增強式學習 (DQN) - 股票操作

昨天已經簡單介紹了 RL、以及 DQN。今天我們來實作增強式學習中的 Deep Q Network 預測股票 (TSMC,俗稱 十萬青年十萬肝,GG輪班救台灣)...

Towards Tensorflow 2.0 系列 第 28

技術 [Day-28] 增強式學習 (Reinforcement learning) 介紹

今天我們來聊聊 增強式學習 (Reinforcement learning),一個最近也很 “潮” 的演算法。 自從 Alpha Go擊敗人類後開始,大家開始重...

鐵人賽 AI & Data DAY 27

技術 [實戰系列] 使用 Keras 搭建一個 DQN 魔法陣(模型)

在理解 DQN 魔法陣的結構後,本篇來帶大家訓練 DQN 模型玩 Flappy Bird,引用參考的程式碼在此:https://github.com/yanpa...

鐵人賽 AI & Data DAY 25

技術 [魔法陣系列] Deep Q Network(DQN)之術式解析

「Deep Learning模型最近若干年的重要进展」一文提到深度學習分四個脈絡: CV/Tensor 生成模型 Sequence Learning Deep...