iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
AI & Data

當個自我強化學習的勇者 系列

近年,AI 技術逐漸普及應用於各個產業中,其功能與重要性越發重要,深度學習(Deep learning) 不斷優化發展,以強化應用於各個領域中。

在機器學習的世界中,要如何自我嘗試錯誤,往上成長,成為勇者呢?
使用強化學習(Reinforcement Learning, RL)成為勇者,那在環境(environment)中它是如何自我嘗試錯誤(trial-and-error)?如何在環境中取得最大化的獎勵(reward)呢?
讓我們一步步成為「強化學習」的勇者吧!

參賽天數 4 天 | 共 5 篇文章 | 0 人訂閱 訂閱系列文 RSS系列文
DAY 1

Day1 - 什麼是增強式學習(Reinforcement Learning, RL)

增強式學習在機器學習中擔任什麼角色呢?它與深度學習又有什麼關係呢? 增強式學習(Reinforcement Learning, RL)是一種機器學習類型,其發...

2023-09-16 ‧ 由 queenawu 分享
DAY 2

Day2 - 什麼是增強式學習(Reinforcement Learning, RL) - Part2

智慧(intelligence )是什麼? " To be able to learn to make decisions to achieve g...

2023-09-17 ‧ 由 queenawu 分享
DAY 3

Day3 - 增強式學習(Reinforcement Learning)中的Agent

在增強式學習中,Agent 泛指被訓練、負責學習的對象,其中,Agent 包含以下四個重要元素: Agent state (負責學習的對象的狀態):在強化學...

2023-09-18 ‧ 由 queenawu 分享
DAY 4

Day4 - 增強式學習(Reinforcement Learning)中的四大步驟

在昨天我們有提到,增強式學習中有四大步驟,那今天我們就開始來逐一說明、建構各個步驟。 Environment 增強式學習(RL)允許環境初始化其內部狀態。以下方...

2023-09-19 ‧ 由 queenawu 分享
DAY 4

Day5 - 在增強式學習中了解「馬可夫決策過程(Markov Decision Process)」

今天要來介紹強化學習中的一理論「馬可夫決策過程」(Markov Decision Process) 前情提要 前幾天我們有提到增強式學習的主要元素包含:獎勵(r...

2023-09-21 ‧ 由 queenawu 分享