iT邦幫忙

ppo相關文章
共有 4 則文章
鐵人賽 AI & Data DAY 9
LLM 學習筆記 系列 第 9

技術 LLM Note Day 9 - LLM 訓練流程

簡介 在開始實際操作 LLM 之前,我們先來瞭解 LLM 的訓練流程。訓練一個 LLM 通常包含兩個步驟:監督式微調與增強式學習,不過也有許多模型只做監督式微調...

技術 ChatGPT GPT-4 Transformer 模型原理及架構

大家好!最近最夯的 AI 聊天機器人: ChatGPT GPT-4 已上架了,筆者在這邊簡單介紹一下其模型。 根據文獻[1][2], 其模型是 Transfor...

鐵人賽 AI/ ML & Data DAY 20

技術 Day19:強化學習在交易中的應用--結合 Stable Baselines 進 Backtrader

在今日教學中,我們將學習如何結合 Stable Baselines 3 和之前大量篇幅介紹的 Backtrader,使用強化學習方法開發一個股票交易策略,終於有...

鐵人賽 AI/ ML & Data DAY 21

技術 Day20:強化學習在交易中的應用--使用 Stable Baselines 3 實現基於 LSTM 的強化學習,並使用 Backtrader 進行回測

在上次的教學中我們使用了 Stable baseline3來搭建我們的 RL agent 並將買賣過程放回 backtrader 上進行視覺化。在本教學中,我們...