iT邦幫忙

rlhf相關文章
共有 1 則文章
鐵人賽 AI & Data DAY 9
LLM 學習筆記 系列 第 9

技術 LLM Note Day 9 - LLM 訓練流程

簡介 在開始實際操作 LLM 之前,我們先來瞭解 LLM 的訓練流程。訓練一個 LLM 通常包含兩個步驟:監督式微調與增強式學習,不過也有許多模型只做監督式微調...