iT邦幫忙

sft相關文章
共有 3 則文章
鐵人賽 DevOps

技術 Day33 - 進階篇:LoRA 微調失敗 N 次才成功?踩坑血淚史

🔹 前言 在 Day32 - 進階篇:Mac M3 本機 LoRA 微調 Qwen2.5 (30 分鐘,準確率 92%) 我完成了 LoRA 微調流程,最終用...

鐵人賽 DevOps

技術 Day32 - 進階篇:Macbook Air M3 本機 LoRA 微調 Qwen2.5(30 分鐘,相似度 92%)

📝 TL;DR > 本文示範如何在 M3 本機完成 LoRA 微調(訓練 30 分鐘),採用 CPU 示範確保通用性,M3 可用 MPS/MLX 加速。...

鐵人賽 AI & Data DAY 9
LLM 學習筆記 系列 第 9

技術 LLM Note Day 9 - LLM 訓練流程

簡介 在開始實際操作 LLM 之前,我們先來瞭解 LLM 的訓練流程。訓練一個 LLM 通常包含兩個步驟:監督式微調與增強式學習,不過也有許多模型只做監督式微調...