iT邦幫忙

鐵人檔案

第 11 屆 iThome 鐵人賽
回列表
AI & Data

人工智慧(RL系列) 完爆遊戲30天 系列

人工智慧遊戲起手式,30天用算法輕鬆play game!

鐵人鍊成 | 共 30 篇文章 | 14 人訂閱 訂閱系列文 RSS系列文
DAY 21

Day21 Double DQN

接下來幾個章節,會介紹Q-learning的進階方法,筆者可親自針對原本專案的Q-learning修改試試,但因為電腦都在跑別的東西了,所以實際效果如何或怎樣就...

2019-10-06 ‧ 由 皮卡喵 分享
DAY 22

Day22 Dueling DQN

對訓練強化學習模型的過程來說,其實許多樣本不是太重要,舉訓練小恐龍的例子,如果移動過程仙人掌出現的次數不頻繁,我們可以認定很多時候的狀態(state)是不重要的...

2019-10-07 ‧ 由 皮卡喵 分享
DAY 23

Day23 prioritized replay(上)

隨機抽取replay memory有效的降低了資料跟資料的關聯,但帶來個問題樣本稀疏問題,像是大部分樣本對訓練是沒幫助的,以小恐龍來說很多時間是沒遇上仙人掌的。...

2019-10-08 ‧ 由 皮卡喵 分享
DAY 24

Day24 prioritized replay(中)

上章講完prioritized遇到的挑戰跟解決方案,這章節就開始講實作囉! SumTree SumTree是種二元節點儲存方式,從上的根節點直到下面底部的節點,...

2019-10-09 ‧ 由 皮卡喵 分享
DAY 25

Day25 prioritized replay(下)

上章節講完結構與找尋點方法,這章介紹怎鑲嵌至訓練過程。 Memory Class 初始化參數 class Memory(object): # stored a...

2019-10-10 ‧ 由 皮卡喵 分享
DAY 26

Day26 自定義環境

之前前幾張有介紹基本的environment方法,這幾張我們來了解實際如何時間。 環境類別 class MyEnv(gym.Env): def init...

2019-10-11 ‧ 由 皮卡喵 分享
DAY 27

Day27 認識Class Box

這章節我們介紹Box的實現首先載入套件 import numpy as np from .space import Space 自定義類別參數 def _...

2019-10-12 ‧ 由 皮卡喵 分享
DAY 28

Day28 認識Class Discrete

跟上章節的Box相比較,Discrete是離散的資料類別 import numpy as np from .space import Space 類別初始化...

2019-10-13 ‧ 由 皮卡喵 分享
DAY 29

Day29 環境註冊

還記得我們第四章介紹的Day_4 環境介紹-gym嗎?關於的gym.make()方法,裡面輸入env_id都是已註冊好的環境,放在anaconda3/lib/p...

2019-10-14 ‧ 由 皮卡喵 分享
DAY 30

Day30 總結與RL展望

致謝 感謝閱讀文章的讀者,初期以為每天抽出1~2小時已足夠,後來才發現創作要花更多時間撰寫(假日一到狂衝內容),調整架構、製作圖,還有些之前自己沒很懂的,需要回...

2019-10-15 ‧ 由 皮卡喵 分享