Day_1 簡介

第 11 屆 iThome 鐵人賽

DAY 1

AI & Data

人工智慧(RL系列) 完爆遊戲30天系列第 1 篇

11th鐵人賽

皮卡喵

2019-09-16 21:17:49

2791 瀏覽

分享至

大家好！歡迎來到人工智慧玩遊戲30天皮卡皮卡！人生第一次這麼大篇幅寫技術文，榨出下班與假日寫作，對於我自己來說，其實已受開源與學術社群非常多的恩惠(譬如讓自己圖個溫飽)，希望能盡綿薄之力回饋給社群。
有地方寫不好的，還希望能指點，或不太理解的，歡迎留言詢問XD

簡介

在AI算法玩遊戲或做連貫性決策過程(例如機器手臂)，我們稱強化學習(Reinforcement Learning)，接下來會有幾塊做介紹：

1.強化學習介紹
2.開發環境建置
3.開源範例實作
4.找些好玩的實作～

前3部分介紹完後，會實作並介紹幾款有趣的遊戲！目前開始會介紹幾個gym的小遊戲，再來是玩Chrome離線小恐龍，後來再想想看玩什麼XD 其實OpenAI已經有開源幾個遊戲實作了，但因為套件框架有點複雜，就簡單介紹幾個例子來玩。再來會自己手搭環境跟算法，實作小恐龍，讓大家可了解整個強化學習來龍去脈。
沙漠中孤獨的小恐龍跳阿跳

大綱介紹

第一部分會介紹用圖文介紹強化學習兩個重要概念，代理人(Agent)、環境(Environment)。
第二部分會用anaconda上的python做開發，套件很安裝挺簡單，pip一下就有哩！
第三部分用開源玩些小範例，可以的話介紹OpenAI環境的統一格式跟命名。
第四部分會找些開源專案帶著大家手把手玩，一邊環境實現，再搭配算法實現。

實作專案請參考DinoRunTutorial專案，按造步驟即可跑小恐龍訓練，如果喜歡還請賞顆星星～