iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
生成式 AI

打造 AI 微調平台:從系統設計到 AI 協作的 30 天實戰筆記 系列

生成式 AI 的蓬勃發展,推動了對模型微調(fine-tuning) 與 平台化開發的強烈需求。本系列以實戰為核心,完整記錄一個可部署、可監控、可回滾的 AI 微調平台的落地過程,涵蓋資料處理、任務排程、訓練與部署、效能監控、多租戶架構等核心模組,並輔以 Kubernetes、MLflow、DVC、Helm Chart 等技術的整合應用。

在落實系統基礎功能的同時,系列文章也嘗試引入 AI 協作的開發模式 —— 包含 AI 生成測試案例、初版設定檔、自動化技術文檔與壓測腳本 等方式,驗證生成式 AI 如何反向參與工程流程,協助開發者提升效率、減少重工,並探索人機協作下的工程最佳化可能性。

參賽天數 29 天 | 共 29 篇文章 | 3 人訂閱 訂閱系列文 RSS系列文 團隊Cyber Edge Runners
DAY 21

[Day 21] 模型共享與推薦 API:讓知識能被重用

完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-21 在過去 20 天,我們完成了任務排程、實驗追蹤、認證與...

2025-10-05 ‧ 由 Pei 分享
DAY 22

[Day 22] MLflow Tracking:把實驗紀錄搬上標準化追蹤

完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-22 在 Day 21,我們讓平台具備了 模型卡與共享 AP...

2025-10-06 ‧ 由 Pei 分享
DAY 23

[Day 23] Registry & DVC 資料版本控制:模型治理雛形

完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-23 在 Day 21,我們有了 Model Card 與共...

2025-10-07 ‧ 由 Pei 分享
DAY 24

[Day 24] 部署最佳實踐:從 Compose → K8s → Helm 的演進

完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-24 在前 20 天,我們已經逐步打造出一個能運作的微調平台...

2025-10-08 ‧ 由 Pei 分享
DAY 25

[Day 25] CI/CD Pipeline:從 Commit 到 Cluster

完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-25 一、為什麼需要 CI/CD? 前面我們已經透過 Hel...

2025-10-09 ‧ 由 Pei 分享
DAY 26

[Day 26] 系統觀測:Prometheus Exporter + Grafana

完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-26 在前 25 天,我們的系統已能從訓練到部署完整運作,但...

2025-10-10 ‧ 由 Pei 分享
DAY 27

[Day 27] 壓測與穩定性分析:模擬真實使用者

完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-27 在前一天,我們已經能用 Prometheus + Gr...

2025-10-11 ‧ 由 Pei 分享
DAY 28

[Day 28] 多租戶最小雛形:Control Plane × Worker Plane

完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-28 當平台同時服務多組使用者(研究人員或專案團隊)時,常會...

2025-10-12 ‧ 由 Pei 分享
DAY 29

[Day 29] Demo Day:從訓練到監控的完整演示

在過去 28 天裡,我們完成了: 可運行的 LoRA 訓練系統(FastAPI + Celery + Redis) 標準化的實驗追蹤(MLflow) 模型共享...

2025-10-13 ‧ 由 Pei 分享