人工智慧(RL系列) 完爆遊戲30天 :: 第 11 屆 iThome 鐵人賽

皮卡喵 (hung10701)

iT邦新手 4 級 ‧ 點數 384

皮卡丘

16904

累計瀏覽數

9人

在追蹤

站內簡訊追蹤

鐵人檔案

第 11 屆 iThome 鐵人賽

回列表

AI & Data

人工智慧(RL系列) 完爆遊戲30天系列

人工智慧遊戲起手式，30天用算法輕鬆play game！

鐵人鍊成｜共 30 篇文章｜ 13 人訂閱訂閱系列文 RSS系列文

0 Like 0 留言 4250 瀏覽

DAY 21

Day21 Double DQN

接下來幾個章節，會介紹Q-learning的進階方法，筆者可親自針對原本專案的Q-learning修改試試，但因為電腦都在跑別的東西了，所以實際效果如何或怎樣就...

2019-10-06 ‧ 由皮卡喵分享

0 Like 0 留言 6122 瀏覽

DAY 22

Day22 Dueling DQN

對訓練強化學習模型的過程來說，其實許多樣本不是太重要，舉訓練小恐龍的例子，如果移動過程仙人掌出現的次數不頻繁，我們可以認定很多時候的狀態(state)是不重要的...

2019-10-07 ‧ 由皮卡喵分享

0 Like 0 留言 1425 瀏覽

DAY 23

Day23 prioritized replay(上)

隨機抽取replay memory有效的降低了資料跟資料的關聯，但帶來個問題樣本稀疏問題，像是大部分樣本對訓練是沒幫助的，以小恐龍來說很多時間是沒遇上仙人掌的。...

2019-10-08 ‧ 由皮卡喵分享

0 Like 0 留言 1414 瀏覽

DAY 24

Day24 prioritized replay(中)

上章講完prioritized遇到的挑戰跟解決方案，這章節就開始講實作囉！ SumTree SumTree是種二元節點儲存方式，從上的根節點直到下面底部的節點，...

2019-10-09 ‧ 由皮卡喵分享

1 Like 0 留言 1555 瀏覽

DAY 25

Day25 prioritized replay(下)

上章節講完結構與找尋點方法，這章介紹怎鑲嵌至訓練過程。 Memory Class 初始化參數 class Memory(object): # stored a...

2019-10-10 ‧ 由皮卡喵分享

0 Like 0 留言 1711 瀏覽

DAY 26

Day26 自定義環境

之前前幾張有介紹基本的environment方法，這幾張我們來了解實際如何時間。環境類別 class MyEnv(gym.Env): def init...

2019-10-11 ‧ 由皮卡喵分享

0 Like 0 留言 1643 瀏覽

DAY 27

Day27 認識Class Box

這章節我們介紹Box的實現首先載入套件 import numpy as np from .space import Space 自定義類別參數 def _...

2019-10-12 ‧ 由皮卡喵分享

0 Like 0 留言 1448 瀏覽

DAY 28

Day28 認識Class Discrete

跟上章節的Box相比較，Discrete是離散的資料類別 import numpy as np from .space import Space 類別初始化...

2019-10-13 ‧ 由皮卡喵分享

0 Like 0 留言 2700 瀏覽

DAY 29

Day29 環境註冊

還記得我們第四章介紹的Day_4 環境介紹-gym嗎？關於的gym.make()方法，裡面輸入env_id都是已註冊好的環境，放在anaconda3/lib/p...

2019-10-14 ‧ 由皮卡喵分享

1 Like 1 留言 1874 瀏覽

DAY 30

Day30 總結與RL展望

致謝感謝閱讀文章的讀者，初期以為每天抽出1~2小時已足夠，後來才發現創作要花更多時間撰寫(假日一到狂衝內容)，調整架構、製作圖，還有些之前自己沒很懂的，需要回...

2019-10-15 ‧ 由皮卡喵分享

皮卡喵的鐵人檔案

皮卡喵的收藏

皮卡喵的追蹤

皮卡喵的Like

皮卡喵的紀錄

皮卡喵的訂閱列表

鐵人檔案

人工智慧(RL系列) 完爆遊戲30天 系列

標記使用者

人工智慧(RL系列) 完爆遊戲30天系列