iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 26
0
AI & Data

人工智慧(RL系列) 完爆遊戲30天系列 第 26

Day26 自定義環境

之前前幾張有介紹基本的environment方法,這幾張我們來了解實際如何時間。

環境類別

class MyEnv(gym.Env):
    def init(self): # 參數初始化
    def reset(self): # 遊戲重置
    def step(self, action): # 執行動作
    def render(self, mode='human', close=False): 資料的視覺化
    def close(self): # 有些擔心會暫住記憶體的可在此實現。
    def seed(self, seed=None): # 隨機種子樹
    def get_reward(self, pos, moved): # 規範reward值

資料屬性

另外OpenAI有幾個定義好的資料類別

  1. Discrete 非負離散資料類別
  2. BOX 離散型資料類別

結語

這章節我們介紹差不多,Discrete跟Box下章節我們講解(這兩種型態都是很重要的資料定義),以及如何去跟OpenAI註冊,方便管理環境跟特定參數,我們明天見囉~

補充參考

OpenAI gym 源碼:https://bre.is/mPXg9dCz


上一篇
Day25 prioritized replay(下)
下一篇
Day27 認識Class Box
系列文
人工智慧(RL系列) 完爆遊戲30天30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言