Day19 LoRA（Low-Rank Adaptation）

2025 iThome 鐵人賽

DAY 19

AI & Data

AI初學者入門系列第 19 篇

17th鐵人賽

kitty71336

團隊新手小黑

2025-08-21 18:49:56

240 瀏覽

分享至

在大型語言模型時代，為了在有限資源下，讓模型快速適應特定領域，過去的做法是全量微調(Full Fine-tuning），直接更新整個模型的所有權重，但這種方法需要龐大的運算資源和消耗大量儲存空間。為了解決這個問題，微軟在 2021 年提出了 LoRA（Low-Rank Adaptation），成為如今高效微調 LLM 的關鍵技術。

從傳統微調到 LoRA

全量微調（Full Fine-tuning）

在最傳統的做法中，我們會同時更新整個 預訓練權重（Pretrained Weight） 和 更新權重（Update Weight），最後得到一個新的「適配後權重（Adapted Weight）」。
這種方式效果最佳，但計算與儲存成本極高。

適配後的完整權重

經過全量微調後，模型會得到一個全新的大權重矩陣，雖然適應了新任務，但需要將整個模型重新儲存與部署，非常不便。

LoRA：低秩分解

LoRA 引入了 低秩分解（Low-Rank Decomposition） 的想法。
它不再直接更新整個矩陣，而是將更新量 ΔW\Delta WΔW 拆解成兩個小矩陣：
ΔW=A⋅B\Delta W = A \cdot B
ΔW=A⋅B
其中 AAA 是隨機初始化的小矩陣，BBB 初始為 0，只需訓練這兩個矩陣即可，這樣就能用極少的參數量達到類似全量微調的效果