過去曾經有個震驚世界的圍棋對局,AlphaGo擊敗韓籍世界圍棋冠軍李世乭,而背後就是賴於深度強化式學習,所以今天就要跟大家介紹「強化式學習(Reinforcem...
今天又是充滿數學的一天啊
還記得在 [Day 19] Diffusion Model 的數學原理(一)的最後,我們得出了 diffusion model 的學習...
上一篇簡述了5個讀取資料的方法,是不是開始迫不及待的想要馬上開始進行Data的操作啦先別急先別急,在我們開始實際針對DataFrame 進行操作之前, 先來看看...
3. SFT訓練與Loss計算
sft訓練的程式碼sft.py
以下為簡化過的程式碼,X, Y, loss_mask的內容如何產生已經在前面介紹SFT da...
今日份 Ferris
今天要讓博士章魚貓跟 Ferris 帶我們開始寫程式碼啦!*professortocat_v2 + Extra-cute ferris
G...
回測
回測的目的
所有的量化交易者都會擔心一件事:交易虧損時風險會不會很大?這時候就需要一些依據讓交易者可以有一些信心能夠繼續交易下去。同時也會根據回測的結果預...