大家好!歡迎來到人工智慧玩遊戲30天皮卡皮卡!人生第一次這麼大篇幅寫技術文,榨出下班與假日寫作,對於我自己來說,其實已受開源與學術社群非常多的恩惠(譬如讓自己圖...
強化學習是什麼東西,它好吃嗎?當然不能(不好意思這裡不是IT美食30天XD) 強化學習能幹嗎? 你可以想像它是個連貫性決策過程,是連貫就會有個開始跟結束(有些例...
已經裝好anaconda跟python的朋友可跳過此章節。沒有的要留下聽好聽滿,這章很重要!那我們就來建置安裝環境吧! Anaconda 我們這邊系統無論是ma...
強化學習是什麼第二章已經描述完哩,接下來這章就要介紹環境(environment)的部分。 簡介 agent的對象,環境(environment)是需要我們去制...
今天pycon2019第一天,好多topic都好有趣!如果覺得有什麼好玩的或想進階想專研,歡迎聯繫有機會一起研究XD好哩接下來要來介紹強化學習最經典的方法:Q-...
今天pycon第二天~看到許多年輕的工程師與強者,深深覺得在看不到地方,也有很多熱情的工程師默默為整個社會提供穩定厚實的技術力量,想到就覺很興奮,自己也要好好好...
前面兩章了解模型概念與知識,今天終於來到了Q-learning的學習了!不然都說人工智慧人工智慧的,就讓我們來了解Q-learning到底智不智慧XD Q-更新...
Q-learning運作跟算法講差不多了,接下來補充幾個後面重要的改進,改進後面還有更多演化變種,不過我們這30天不會講得太深入,但面臨哪些問題挑戰一定要知道~...
OpenAi提供的baselines囊括了許多強化學習算法,包括我們前面講解的Q-learning,這篇會簡單帶大家跑個範例程式碼,大家也可以調整參數玩玩看。另...
努力拼了幾天Q-learning,接下來就要連續幾天小恐龍實作囉XD~ 簡介 之前介紹過gym跟baselines組合,讓agent跟environment的兩...