Day 19 . 我想讓我的AI學會比較刺激的東西，微調 (Fine-tuning)他一下

2025 iThome 鐵人賽

DAY 19

生成式 AI

30天從不認識生成式AI到好像稍微可能有點熟悉的過程系列第 19 篇

17th鐵人賽

jiaofish

團隊週三遜咖日

2025-09-26 17:13:40

116 瀏覽

分享至

今天我們要來介紹微調 (Fine-tuning)是什麼東東，因為雖然我們在詢問AI時，他可以直接透過RAG搜尋資料，但有時候還是會希望模型能永久學會某些專業知識或特定風格，不用每次都重新餵資料(很麻煩)，這時候微調 (Fine-tuning)就派上用場了。

微調是什麼?
微調的意思是：在原本訓練好的大語言模型上，再用一小批專屬資料重新訓練，
讓模型更適合特定領域或任務。
像是可以 :
你有需要跟靠戶溝通的需求，希望模型能用比較「官方語氣」來回答客戶的問題。
你寫了很多技術文件，希望模型能像你一樣解釋程式。
你需要特定格式（如固定 JSON 結構）輸出。
只要把這些範例餵給模型，它就能學會你的風格與知識。

微調的流程?
1.準備資料
格式通常是 JSONL，每筆資料包含 prompt 和 completion，簡單範例 :

{"prompt": "請用簡單方式解釋量子電腦", "completion": "量子電腦利用量子位元進行運算..."}

2.上傳並訓練
例如 OpenAI 有提供 fine_tunes API，可以上傳資料集開始訓練。
3.試用微調後模型
訓練完成後，你會得到一個專屬的模型名稱，未來想使用時呼叫API直接指定就可以了。

一些工具與平台
OpenAI Fine-tuning API：比較簡單適合初學者。
Hugging Face Transformers：適合想自己掌控細節的開發者。
LoRA (Low-Rank Adaptation)：輕量化微調技術，適合硬體資源有限的人(像是我)。
本地工具：可搭配 llama.cpp / ollama 自行微調開源模型。