接下來幾個章節,會介紹Q-learning的進階方法,筆者可親自針對原本專案的Q-learning修改試試,但因為電腦都在跑別的東西了,所以實際效果如何或怎樣就...
對訓練強化學習模型的過程來說,其實許多樣本不是太重要,舉訓練小恐龍的例子,如果移動過程仙人掌出現的次數不頻繁,我們可以認定很多時候的狀態(state)是不重要的...
隨機抽取replay memory有效的降低了資料跟資料的關聯,但帶來個問題樣本稀疏問題,像是大部分樣本對訓練是沒幫助的,以小恐龍來說很多時間是沒遇上仙人掌的。...
上章講完prioritized遇到的挑戰跟解決方案,這章節就開始講實作囉! SumTree SumTree是種二元節點儲存方式,從上的根節點直到下面底部的節點,...
上章節講完結構與找尋點方法,這章介紹怎鑲嵌至訓練過程。 Memory Class 初始化參數 class Memory(object): # stored a...
之前前幾張有介紹基本的environment方法,這幾張我們來了解實際如何時間。 環境類別 class MyEnv(gym.Env): def init...
這章節我們介紹Box的實現首先載入套件 import numpy as np from .space import Space 自定義類別參數 def _...
跟上章節的Box相比較,Discrete是離散的資料類別 import numpy as np from .space import Space 類別初始化...
還記得我們第四章介紹的Day_4 環境介紹-gym嗎?關於的gym.make()方法,裡面輸入env_id都是已註冊好的環境,放在anaconda3/lib/p...
致謝 感謝閱讀文章的讀者,初期以為每天抽出1~2小時已足夠,後來才發現創作要花更多時間撰寫(假日一到狂衝內容),調整架構、製作圖,還有些之前自己沒很懂的,需要回...