生成式 AI 的蓬勃發展,推動了對模型微調(fine-tuning) 與 平台化開發的強烈需求。本系列以實戰為核心,完整記錄一個可部署、可監控、可回滾的 AI 微調平台的落地過程,涵蓋資料處理、任務排程、訓練與部署、效能監控、多租戶架構等核心模組,並輔以 Kubernetes、MLflow、DVC、Helm Chart 等技術的整合應用。
在落實系統基礎功能的同時,系列文章也嘗試引入 AI 協作的開發模式 —— 包含 AI 生成測試案例、初版設定檔、自動化技術文檔與壓測腳本 等方式,驗證生成式 AI 如何反向參與工程流程,協助開發者提升效率、減少重工,並探索人機協作下的工程最佳化可能性。
完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-21 在過去 20 天,我們完成了任務排程、實驗追蹤、認證與...
完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-22 在 Day 21,我們讓平台具備了 模型卡與共享 AP...
完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-23 在 Day 21,我們有了 Model Card 與共...
完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-24 在前 20 天,我們已經逐步打造出一個能運作的微調平台...
完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-25 一、為什麼需要 CI/CD? 前面我們已經透過 Hel...
完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-26 在前 25 天,我們的系統已能從訓練到部署完整運作,但...
完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-27 在前一天,我們已經能用 Prometheus + Gr...
完整程式碼可在 GitHub 專案中找到:Finetune-30-days-demo / day-28 當平台同時服務多組使用者(研究人員或專案團隊)時,常會...
在過去 28 天裡,我們完成了: 可運行的 LoRA 訓練系統(FastAPI + Celery + Redis) 標準化的實驗追蹤(MLflow) 模型共享...