昨天不知道各位有沒有更加了解stable_baselines3這個模組了,今天要直接帶大家來看看官方文檔中的一些範例。藉此讓各位對強化訓練有基本的認識,基本上改...
各位不知道有沒有期待今天的到來,過了22天才終於進入到實際使用強化學習的環節。我覺得其實30天說長不長說短不短,不知不覺也過了2/3了,也到了該是收穫果實的時候...
經過了一天的訓練,不知道各位的機器人有沒有從中學習到甚麼,今天會分享一下我在訓練前中後期的一些情況。 訓練前期 訓練前期因為機器人還完全不知道該怎麼移動,所以基...
今天要介紹模糊控制,你可能會想:欸?不是已經介紹完強化學習了嗎怎麼又蹦出一個模糊控制。其實模糊控制是我之前做實驗有使用過的一項技術,而且我也覺得蠻有趣的,所以想...
今天會帶大家來看看隸屬函數,這個說簡單不簡單說難也不難的函數到底長甚麼樣呢?一起來一探究竟吧。這邊會介紹幾個常用的隸屬函數,其規則跟一些特性需要注意一下。通常會...
今天會帶大家來看看我們的觀察值的區間,通常可以算出來的話就會直接算出最大最小值,不過如果沒辦法計算的話,通常我就會不斷紀錄每一step的觀察值並決定區間要落在哪...
昨天實作了Triangular mf,今天會使用GeneralizedBell mf,雖然我不常使用他,不過他的設定也蠻簡單的,先來看看他的特性吧。 特性 正如...
昨天使用過了GeneralizedBell_mf,今天帶大家實作我私心最常用的Gaussian&Sigmoid mf,這個函數沒有像前天Triangul...
經過了四個禮拜28天的學習,相信各位對強化學習應該都已經有基礎的認識了,各位在閒暇時也可以試著自己從0開始建立環境。今天我想要分享一下強化學習的延伸應用,有其他...
今天是最後一天了!這次比賽也迎來了尾聲,發文的時候我也常常看到自己的文章還有很多不足,也因為我是第一次參賽,所以收穫非常非常多,需要改進檢討的也很多。若是有機會...