iT邦幫忙

強化學習相關文章
共有 13 則文章
鐵人賽 AI/ ML & Data DAY 12

技術 [Day 12]強化學習實戰最終章:FrozenLakeAgent 完整訓練與評估展示

前言 終於到了我們強化學習的最終章節了,今天就會把我們整個訓練完成囉,那廢話不多說,直接來看我們的程式! 程式 run功能 在這邊我們定義了一個運行的函數,...

鐵人賽 AI/ ML & Data DAY 11

技術 [Day 11] 從理論到實踐:完成Frozen Lake的Q-learning訓練

前言 昨天提到了一個Q-learning中的策略 Epsilon-greedy 策略,那這個東西到底是甚麼呢?他跟Q-learning有甚麼關係呢?今天的文章就...

鐵人賽 AI/ ML & Data DAY 10

技術 [Day10] Q-Learning 深入解讀:FrozenLakeAgent 訓練流程全解析

前言 昨天介紹了有關gymnasium的一些基礎概念,而今天我們會一步一步來建立我們的Frozen Lake。這篇文章寫得有點亂,自己一時之間也沒有想到更好的改...

鐵人賽 AI/ ML & Data DAY 9

技術 [Day9] 當強化學習遇上健身房!?

Day9 當強化學習遇上gymnasium 前言 在前幾篇的文章中,介紹了強化學習(Reinforcement Learning, RL)的基本概念和原理,也有...

鐵人賽 AI/ ML & Data DAY 8

技術 [Day8] 探討強化學習的秘密 - 策略與價值

Day8 常見的強化學習算法 Value-Based 及 Policy-Based 深度強化學習(Deep Reinforcement Learning, DR...

鐵人賽 AI/ ML & Data DAY 7

技術 [Day7] 強化式學習初探討

Day7 強化學習 前言 還記得好幾年前甚麼都不懂的時候有看到AlphaGo戰勝最強棋王,那時候只知道AI好厲害,但根本不知道那是什麼東西,過了幾年開始接觸到了...

鐵人賽 AI & Data DAY 24

技術 [DAY24] 機器學習 - 強化學習

強化學習概論 讓智慧型代理人/智慧體/智能體(intelligent agent)通過與環境的交互學習如何做出決策,以最大化一個獎勵信號。它通常涉及到Agent...

鐵人賽 AI & Data DAY 4

技術 Day4 奇獸圖鑑-機器學習的種類

進到AI世界的第四天,經過歷史老師和地理老師摧殘後,終於輪到生物老師來教學啦! 但是你看了一下黑板上的描畫,有的由一堆相連的圈圈組成,像一串葡萄,有些又像是高聳...

鐵人賽 AI & Data DAY 11

技術 Day 10. 機器學習模型 - 強化學習

監督和非監督式學習使用了所有的資料來學習進行預測,但是在強化學習中,並非所有資料從一開始就看得見,而是透過摸索的形式和環境互動取得經驗,從錯誤中學習找到一個長期...

鐵人賽 AI & Data DAY 7

達標好文 技術 Day 6. 機器學習模型 - 學習的種類

當我們了解了 AI 的各種手法,就可以知道哪些想法在 AI 技術上是可行的,也能針對我們的目標知道需要什麼資料和要使用什麼演算法來建立模型(Model)。 資...

鐵人賽 AI & Data DAY 11

技術 Day 11: 人工智慧在音樂領域的應用 (機器學習/深度學習與類神經網路二)

機器學習簡介 (Machine Learning, ML) 機器學習是一種透過資料、特徵擷取以及訓練的方式,來幫助電腦能夠學習並且辨認出特定領域的知識。而機器學...

AI 高中生的自我學習 系列 第 27

技術 Day 27 - 強化學習 Reinforcement Learning(1)

馬可夫決策過程 Markov decision process MDP 在概率論和統計學中,馬可夫決策過程(英語:Markov Decision Proce...

技術 人工智慧-機器學習-強化學習-深度學習-卷積網路

因為自己不太懂,所以就整理了一下,這之間的關係。 人工智慧(Artificial Intelligence,AI) 指由人製造出來的機器,所表現出來的智慧型。...