人工智慧(RL系列) 完爆遊戲30天 :: 第 11 屆 iThome 鐵人賽

皮卡喵 (hung10701)

iT邦新手 4 級 ‧ 點數 384

皮卡丘

17217

累計瀏覽數

9人

在追蹤

站內簡訊追蹤

鐵人檔案

第 11 屆 iThome 鐵人賽

回列表

AI & Data

人工智慧(RL系列) 完爆遊戲30天系列

人工智慧遊戲起手式，30天用算法輕鬆play game！

鐵人鍊成｜共 30 篇文章｜ 13 人訂閱訂閱系列文 RSS系列文

1 Like 0 留言 3283 瀏覽

DAY 1

Day_1 簡介

大家好！歡迎來到人工智慧玩遊戲30天皮卡皮卡！人生第一次這麼大篇幅寫技術文，榨出下班與假日寫作，對於我自己來說，其實已受開源與學術社群非常多的恩惠(譬如讓自己圖...

2019-09-16 ‧ 由皮卡喵分享

0 Like 0 留言 3143 瀏覽

DAY 2

Day_2 強化學習介紹

強化學習是什麼東西，它好吃嗎？當然不能(不好意思這裡不是IT美食30天XD) 強化學習能幹嗎？你可以想像它是個連貫性決策過程，是連貫就會有個開始跟結束(有些例...

2019-09-17 ‧ 由皮卡喵分享

1 Like 0 留言 3666 瀏覽

DAY 3

Day_3 環境建置

已經裝好anaconda跟python的朋友可跳過此章節。沒有的要留下聽好聽滿，這章很重要!那我們就來建置安裝環境吧！ Anaconda 我們這邊系統無論是ma...

2019-09-18 ‧ 由皮卡喵分享

0 Like 0 留言 17774 瀏覽

DAY 4

Day_4 環境介紹-gym

強化學習是什麼第二章已經描述完哩，接下來這章就要介紹環境(environment)的部分。簡介 agent的對象，環境(environment)是需要我們去制...

2019-09-19 ‧ 由皮卡喵分享

1 Like 0 留言 7583 瀏覽

DAY 5

Day_5 Q-learning Q-table

今天pycon2019第一天，好多topic都好有趣！如果覺得有什麼好玩的或想進階想專研，歡迎聯繫有機會一起研究XD好哩接下來要來介紹強化學習最經典的方法：Q-...

2019-09-20 ‧ 由皮卡喵分享

0 Like 0 留言 3861 瀏覽

DAY 6

Day_6 Q-learning value

今天pycon第二天～看到許多年輕的工程師與強者，深深覺得在看不到地方，也有很多熱情的工程師默默為整個社會提供穩定厚實的技術力量，想到就覺很興奮，自己也要好好好...

2019-09-21 ‧ 由皮卡喵分享

0 Like 0 留言 3452 瀏覽

DAY 7

Day_7 Q-learning 更新

前面兩章了解模型概念與知識，今天終於來到了Q-learning的學習了！不然都說人工智慧人工智慧的，就讓我們來了解Q-learning到底智不智慧XD Q-更新...

2019-09-22 ‧ 由皮卡喵分享

0 Like 0 留言 4838 瀏覽

DAY 8

Day_8 Q-learning Natural

Q-learning運作跟算法講差不多了，接下來補充幾個後面重要的改進，改進後面還有更多演化變種，不過我們這30天不會講得太深入，但面臨哪些問題挑戰一定要知道～...

2019-09-23 ‧ 由皮卡喵分享

1 Like 0 留言 4563 瀏覽

DAY 9

Day_9 baselines 算法集合

OpenAi提供的baselines囊括了許多強化學習算法，包括我們前面講解的Q-learning，這篇會簡單帶大家跑個範例程式碼，大家也可以調整參數玩玩看。另...

2019-09-24 ‧ 由皮卡喵分享

0 Like 0 留言 3220 瀏覽

DAY 10

Day10 初探小恐龍

努力拼了幾天Q-learning，接下來就要連續幾天小恐龍實作囉XD~ 簡介之前介紹過gym跟baselines組合，讓agent跟environment的兩...

2019-09-25 ‧ 由皮卡喵分享

皮卡喵的鐵人檔案

皮卡喵的收藏

皮卡喵的追蹤

皮卡喵的Like

皮卡喵的紀錄

皮卡喵的訂閱列表

鐵人檔案

人工智慧(RL系列) 完爆遊戲30天 系列

標記使用者

人工智慧(RL系列) 完爆遊戲30天系列