iT邦幫忙

鐵人檔案

2022 iThome 鐵人賽
回列表
自我挑戰組

高中生也可以!利用強化學習讓機器人動起來! 系列

因應目前程式設計也被納入國高中必修課。所以我希望我的系列文高中生甚至國中生也能理解。並在此基礎上建立起第一個強化學習專案。

鐵人鍊成 | 共 30 篇文章 | 8 人訂閱 訂閱系列文 RSS系列文
DAY 21

D21:stable_baselines3範例&PPO演算法基本API

昨天不知道各位有沒有更加了解stable_baselines3這個模組了,今天要直接帶大家來看看官方文檔中的一些範例。藉此讓各位對強化訓練有基本的認識,基本上改...

2022-09-22 ‧ 由 golucky_sir 分享
DAY 22

D22:使用強化學習訓練自己的環境

各位不知道有沒有期待今天的到來,過了22天才終於進入到實際使用強化學習的環節。我覺得其實30天說長不長說短不短,不知不覺也過了2/3了,也到了該是收穫果實的時候...

2022-09-23 ‧ 由 golucky_sir 分享
DAY 23

D23:強化學習訓練過程分享

經過了一天的訓練,不知道各位的機器人有沒有從中學習到甚麼,今天會分享一下我在訓練前中後期的一些情況。 訓練前期 訓練前期因為機器人還完全不知道該怎麼移動,所以基...

2022-09-24 ‧ 由 golucky_sir 分享
DAY 24

D24:模糊控制(fuzzy control)介紹

今天要介紹模糊控制,你可能會想:欸?不是已經介紹完強化學習了嗎怎麼又蹦出一個模糊控制。其實模糊控制是我之前做實驗有使用過的一項技術,而且我也覺得蠻有趣的,所以想...

2022-09-25 ‧ 由 golucky_sir 分享
DAY 25

D25:常用的隸屬函數介紹

今天會帶大家來看看隸屬函數,這個說簡單不簡單說難也不難的函數到底長甚麼樣呢?一起來一探究竟吧。這邊會介紹幾個常用的隸屬函數,其規則跟一些特性需要注意一下。通常會...

2022-09-26 ‧ 由 golucky_sir 分享
DAY 26

D26:實作隸屬函數(1/3)—Triangular mf

今天會帶大家來看看我們的觀察值的區間,通常可以算出來的話就會直接算出最大最小值,不過如果沒辦法計算的話,通常我就會不斷紀錄每一step的觀察值並決定區間要落在哪...

2022-09-27 ‧ 由 golucky_sir 分享
DAY 27

D27:實作隸屬函數(2/3)—GeneralizedBell_mf

昨天實作了Triangular mf,今天會使用GeneralizedBell mf,雖然我不常使用他,不過他的設定也蠻簡單的,先來看看他的特性吧。 特性 正如...

2022-09-28 ‧ 由 golucky_sir 分享
DAY 28

D28:實作隸屬函數(3/3)—Gaussian&Sigmoid mf

昨天使用過了GeneralizedBell_mf,今天帶大家實作我私心最常用的Gaussian&Sigmoid mf,這個函數沒有像前天Triangul...

2022-09-29 ‧ 由 golucky_sir 分享
DAY 29

D29:強化學習小總結

經過了四個禮拜28天的學習,相信各位對強化學習應該都已經有基礎的認識了,各位在閒暇時也可以試著自己從0開始建立環境。今天我想要分享一下強化學習的延伸應用,有其他...

2022-09-30 ‧ 由 golucky_sir 分享
DAY 30

D30:關於這次鐵人賽!

今天是最後一天了!這次比賽也迎來了尾聲,發文的時候我也常常看到自己的文章還有很多不足,也因為我是第一次參賽,所以收穫非常非常多,需要改進檢討的也很多。若是有機會...

2022-10-01 ‧ 由 golucky_sir 分享