iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

ppo相關文章

共有 4 則文章

0 人追蹤

追蹤

鐵人賽 AI & Data DAY 9

LLM 學習筆記系列第 9 篇

簡介在開始實際操作 LLM 之前，我們先來瞭解 LLM 的訓練流程。訓練一個 LLM 通常包含兩個步驟：監督式微調與增強式學習，不過也有許多模型只做監督式微調...

Penut Chen ‧ 2023-09-24 ‧團隊消波塊上的海洋貓貓

大家好！最近最夯的 AI 聊天機器人: ChatGPT GPT-4 已上架了,筆者在這邊簡單介紹一下其模型。根據文獻[1][2], 其模型是 Transfor...

M.H. ‧ 2023-05-16

鐵人賽 AI/ ML & Data DAY 21

打開就會 AI 與數據分析的投資理財術系列第 21 篇

在上次的教學中我們使用了 Stable baseline3來搭建我們的 RL agent 並將買賣過程放回 backtrader 上進行視覺化。在本教學中，我們...

zivzhong ‧ 2024-10-05

鐵人賽 AI/ ML & Data DAY 20

打開就會 AI 與數據分析的投資理財術系列第 20 篇

在今日教學中，我們將學習如何結合 Stable Baselines 3 和之前大量篇幅介紹的 Backtrader，使用強化學習方法開發一個股票交易策略，終於有...

zivzhong ‧ 2024-10-04