iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
生成式 AI

打造 AI 微調平台:從系統設計到 AI 協作的 30 天實戰筆記 系列

生成式 AI 的蓬勃發展,推動了對模型微調(fine-tuning) 與 平台化開發的強烈需求。本系列以實戰為核心,完整記錄一個可部署、可監控、可回滾的 AI 微調平台的落地過程,涵蓋資料處理、任務排程、訓練與部署、效能監控、多租戶架構等核心模組,並輔以 Kubernetes、MLflow、DVC、Helm Chart 等技術的整合應用。

在落實系統基礎功能的同時,系列文章也嘗試引入 AI 協作的開發模式 —— 包含 AI 生成測試案例、初版設定檔、自動化技術文檔與壓測腳本 等方式,驗證生成式 AI 如何反向參與工程流程,協助開發者提升效率、減少重工,並探索人機協作下的工程最佳化可能性。

參賽天數 8 天 | 共 8 篇文章 | 3 人訂閱 訂閱系列文 RSS系列文 團隊Cyber Edge Runners
DAY 1

[Day 1] 為什麼我們需要一個 fine-tune 平台?

生成式 AI 正在快速滲透各行各業,從客服自動化到內容生成,都能看到 LLM(大型語言模型)的應用。然而,當企業需要讓模型更貼近特定場景時,僅依賴 API 調用...

2025-09-15 ‧ 由 Pei 分享
DAY 2

[Day 2] 平台架構全覽:從資料收集到模型部署的全流程

在 Day 1,我們談到微調平台的必要性與挑戰。今天,我們退一步,從高層視角來看,一個「可用的微調平台」應該包含哪些模組,並用架構圖與總覽表快速帶過全流程。...

2025-09-16 ‧ 由 Pei 分享
DAY 3

[Day 3] 探索 LoRA 和 PEFT 的高效微調

完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-3 在上一篇,我們從高層視角看過微調平台的完整架構。今天則聚...

2025-09-17 ‧ 由 Pei 分享
DAY 4

[Day 4] 訓練資料管理:版本、偏差與錯誤影響

完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-4 在做實驗時,常常會遇到這樣的情況:模型表現和上次不同,但...

2025-09-18 ‧ 由 Pei 分享
DAY 5

[Day 5] 訓練參數與 Config 設計:建立統一的配置系統

完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-5 從今天開始,為了呼應這個系列的主題——AI 協作實戰筆記,...

2025-09-19 ‧ 由 Pei 分享
DAY 6

[Day 6] 日誌與結果管理:讓每次實驗有自己的家

完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-6 在前幾天,我們已經能順利完成訓練、管理資料、集中配置。但...

2025-09-20 ‧ 由 Pei 分享
DAY 7

[Day 7] 任務排程基礎:Celery + Redis 的非同步訓練

完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-7 在前幾天,我們的訓練流程仍然是直接跑 python tr...

2025-09-21 ‧ 由 Pei 分享
DAY 8

[Day 8] 最小化 UI:Streamlit 任務提交與追蹤

完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-8 在 Day 7,我們用 Celery + Redis 解...

2025-09-22 ‧ 由 Pei 分享