Day30 總結與RL展望

第 11 屆 iThome 鐵人賽

DAY 30

AI & Data

人工智慧(RL系列) 完爆遊戲30天系列第 30 篇

11th鐵人賽

皮卡喵

2019-10-15 14:12:34

1911 瀏覽

分享至

致謝

感謝閱讀文章的讀者，初期以為每天抽出1~2小時已足夠，後來才發現創作要花更多時間撰寫(假日一到狂衝內容)，調整架構、製作圖，還有些之前自己沒很懂的，需要回頭翻閱文獻，感謝看完的讀者，也感謝看了部分的，有些自己不滿意的內容會在做調整，以及整理成github，謝謝大家。

總結

除了最經典的DQN了解與環境建置，加上離線小恐龍的練習，相信大家都已對這塊有基本認識，但除了離散控制外還有連續控制的領域DDPG，讓算法可以像是控制速度或方向盤一樣操作，而不僅是遊戲操作。有興趣的可以再去搜尋DDPG的資料，希望本系列帶來的不是結束，而是一個新領域的開始。

展望

除了眾所皆知的無人車、無人機駕駛。筆者目前在研究強化學習在機器手臂的應用，歡迎大家有機會與我交流。除了控制外還有些超參數的設定也可用RL，不僅限於打遊戲，我相信連續決策與控制的應用會越來越廣。首要的高維資訊在決策上難以突破，再來是做simulation的部分，應用場景可否用程式碼模擬出來...還有待更多研究來突破。