iT邦幫忙

鐵人檔案

第 11 屆 iT 邦幫忙鐵人賽
回列表
AI & Data

人工智慧(RL系列) 完爆遊戲30天 系列

人工智慧遊戲起手式,30天用算法輕鬆play game!

鐵人鍊成 | 共 30 篇文章 | 9 人訂閱 訂閱系列文 RSS系列文
DAY 1

Day_1 簡介

大家好!歡迎來到人工智慧玩遊戲30天皮卡皮卡!人生第一次這麼大篇幅寫技術文,榨出下班與假日寫作,對於我自己來說,其實已受開源與學術社群非常多的恩惠(譬如讓自己圖...

2019-09-16 ‧ 由 皮卡喵 分享
DAY 2

Day_2 強化學習介紹

強化學習是什麼東西,它好吃嗎? 當然不能(不好意思這裡不是IT美食30天XD) 強化學習能幹嗎? 你可以想像它是個連貫性決策過程,是連貫就會有個開始跟結束(有些...

2019-09-17 ‧ 由 皮卡喵 分享
DAY 3

Day_3 環境建置

已經裝好anaconda跟python的朋友可跳過此章節。 沒有的要留下聽好聽滿,這章很重要!那我們就來建置安裝環境吧! Anaconda 我們這邊系統無論是m...

2019-09-18 ‧ 由 皮卡喵 分享
DAY 4

Day_4 環境介紹-gym

強化學習是什麼第二章已經描述完哩,接下來這章就要介紹環境(environment)的部分。 簡介 agent的對象,環境(environment)是需要我們去制...

2019-09-19 ‧ 由 皮卡喵 分享
DAY 5

Day_5 Q-learning Q-table

今天pycon2019第一天,好多topic都好有趣!如果覺得有什麼好玩的或想進階想專研,歡迎聯繫有機會一起研究XD好哩接下來要來介紹強化學習最經典的方法:Q-...

2019-09-20 ‧ 由 皮卡喵 分享
DAY 6

Day_6 Q-learning value

今天pycon第二天~看到許多年輕的工程師與強者,深深覺得在看不到地方,也有很多熱情的工程師默默為整個社會提供穩定厚實的技術力量,想到就覺很興奮,自己也要好好好...

2019-09-21 ‧ 由 皮卡喵 分享
DAY 7

Day_7 Q-learning 更新

前面兩章了解模型概念與知識,今天終於來到了Q-learning的學習了!不然都說人工智慧人工智慧的,就讓我們來了解Q-learning到底智不智慧XD Q-更新...

2019-09-22 ‧ 由 皮卡喵 分享
DAY 8

Day_8 Q-learning Natural

Q-learning運作跟算法講差不多了,接下來補充幾個後面重要的改進,改進後面還有更多演化變種,不過我們這30天不會講得太深入,但面臨哪些問題挑戰一定要知道~...

2019-09-23 ‧ 由 皮卡喵 分享
DAY 9

Day_9 baselines 算法集合

OpenAi提供的baselines囊括了許多強化學習算法,包括我們前面講解的Q-learning,這篇會簡單帶大家跑個範例程式碼,大家也可以調整參數玩玩看。另...

2019-09-24 ‧ 由 皮卡喵 分享
DAY 10

Day10 初探小恐龍

努力拼了幾天Q-learning,接下來就要連續幾天小恐龍實作囉XD~ 簡介 之前介紹過gym跟baselines組合,讓agent跟environment的兩...

2019-09-25 ‧ 由 皮卡喵 分享