iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

強化學習相關文章

共有 14 則文章

2 人追蹤

追蹤

0 Like 0 留言 1202 瀏覽

鐵人賽 AI/ ML & Data DAY 12

深度學習的學習之旅：從理論到實作系列第 12 篇

技術 [Day 12]強化學習實戰最終章：FrozenLakeAgent 完整訓練與評估展示

前言終於到了我們強化學習的最終章節了，今天就會把我們整個訓練完成囉，那廢話不多說，直接來看我們的程式！程式 run功能在這邊我們定義了一個運行的函數，...

bin ‧ 2024-09-20 ‧團隊NUTC imac

0 Like 1 留言 1688 瀏覽

鐵人賽 AI/ ML & Data DAY 11

深度學習的學習之旅：從理論到實作系列第 11 篇

技術 [Day 11] 從理論到實踐：完成Frozen Lake的Q-learning訓練

前言昨天提到了一個Q-learning中的策略 Epsilon-greedy 策略，那這個東西到底是甚麼呢？他跟Q-learning有甚麼關係呢？今天的文章就...

bin ‧ 2024-09-19 ‧團隊NUTC imac

2 Like 0 留言 1910 瀏覽

鐵人賽 AI/ ML & Data DAY 10

深度學習的學習之旅：從理論到實作系列第 10 篇

技術 [Day10] Q-Learning 深入解讀：FrozenLakeAgent 訓練流程全解析

前言昨天介紹了有關gymnasium的一些基礎概念，而今天我們會一步一步來建立我們的Frozen Lake。這篇文章寫得有點亂，自己一時之間也沒有想到更好的改...

bin ‧ 2024-09-18 ‧團隊NUTC imac

1 Like 0 留言 3355 瀏覽

鐵人賽 AI/ ML & Data DAY 9

深度學習的學習之旅：從理論到實作系列第 9 篇

技術 [Day9] 當強化學習遇上健身房!?

Day9 當強化學習遇上gymnasium 前言在前幾篇的文章中，介紹了強化學習（Reinforcement Learning, RL）的基本概念和原理，也有...

bin ‧ 2024-09-17 ‧團隊NUTC imac

1 Like 0 留言 2953 瀏覽

鐵人賽 AI/ ML & Data DAY 8

深度學習的學習之旅：從理論到實作系列第 8 篇

技術 [Day8] 探討強化學習的秘密 - 策略與價值

Day8 常見的強化學習算法 Value-Based 及 Policy-Based 深度強化學習（Deep Reinforcement Learning, DR...

bin ‧ 2024-09-16 ‧團隊NUTC imac

1 Like 0 留言 2395 瀏覽

鐵人賽 AI/ ML & Data DAY 7

深度學習的學習之旅：從理論到實作系列第 7 篇

技術 [Day7] 強化式學習初探討

Day7 強化學習前言還記得好幾年前甚麼都不懂的時候有看到AlphaGo戰勝最強棋王，那時候只知道AI好厲害，但根本不知道那是什麼東西，過了幾年開始接觸到了...

bin ‧ 2024-09-15 ‧團隊NUTC imac

0 Like 0 留言 3025 瀏覽

技術為什麼機器人的研究都做強化學習？

過去學相關課程時，我記得老師很突然地就開始教強化學習了，也沒說為什麼，完全找不到時機問「為什麼用強化學習？」最近複習筆記時這個問題又浮上心頭，不可能只有我很好奇...

欸利 ‧ 2025-04-02

1 Like 0 留言 1942 瀏覽

鐵人賽 AI & Data DAY 24

關於我從基礎程設轉職到人工智慧入門系列第 24 篇

技術 [DAY24] 機器學習 - 強化學習

強化學習概論讓智慧型代理人/智慧體/智能體（intelligent agent）通過與環境的交互學習如何做出決策，以最大化一個獎勵信號。它通常涉及到Agent...

泉韵 ‧ 2023-10-09 ‧團隊每件事都壓死線的大家真的可以完賽嗎？

0 Like 0 留言 1313 瀏覽

鐵人賽 AI & Data DAY 4

跟我一起在AI的世界裡打怪獸系列第 4 篇

技術 Day4 奇獸圖鑑－機器學習的種類

進到AI世界的第四天，經過歷史老師和地理老師摧殘後，終於輪到生物老師來教學啦！但是你看了一下黑板上的描畫，有的由一堆相連的圈圈組成，像一串葡萄，有些又像是高聳...

初墨 Roy ‧ 2023-09-19

3 Like 0 留言 3140 瀏覽

鐵人賽 AI & Data DAY 11

OH～ AI 原來如此，互助就此開始！系列第 11 篇

技術 Day 10. 機器學習模型 - 強化學習

監督和非監督式學習使用了所有的資料來學習進行預測，但是在強化學習中，並非所有資料從一開始就看得見，而是透過摸索的形式和環境互動取得經驗，從錯誤中學習找到一個長期...

henry_chen ‧ 2022-09-25

6 Like 0 留言 23992 瀏覽

鐵人賽 AI & Data DAY 7

OH～ AI 原來如此，互助就此開始！系列第 7 篇

達標好文技術 Day 6. 機器學習模型 - 學習的種類

當我們了解了 AI 的各種手法，就可以知道哪些想法在 AI 技術上是可行的，也能針對我們的目標知道需要什麼資料和要使用什麼演算法來建立模型（Model）。資...

henry_chen ‧ 2022-09-21

4 Like 1 留言 4139 瀏覽

鐵人賽 AI & Data DAY 11

人工智慧在音樂領域的應用系列第 11 篇

技術 Day 11: 人工智慧在音樂領域的應用 (機器學習/深度學習與類神經網路二)

機器學習簡介 (Machine Learning, ML) 機器學習是一種透過資料、特徵擷取以及訓練的方式，來幫助電腦能夠學習並且辨認出特定領域的知識。而機器學...

fd2 ‧ 2021-09-26 ‧團隊森上梅友前

1 Like 0 留言 8102 瀏覽

鐵人賽自我挑戰組

AI 高中生的自我學習系列第 27 篇

技術 Day 27 - 強化學習 Reinforcement Learning(1)

馬可夫決策過程 Markov decision process MDP 在概率論和統計學中，馬可夫決策過程（英語：Markov Decision Proce...

Harry Lin ‧ 2020-12-27

1 Like 0 留言 11389 瀏覽

技術人工智慧－機器學習－強化學習－深度學習－卷積網路

因為自己不太懂，所以就整理了一下，這之間的關係。人工智慧（Artificial Intelligence，AI）指由人製造出來的機器，所表現出來的智慧型。...

g085785 ‧ 2020-01-15

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

趣味SQL，給了一組編號後，用SQL產生亂數編碼的結果(更新Copilot及Google AI見解，SQL只能貼圖)

IT邦幫忙