30 天帶你實戰 LLMOps：從 RAG 到觀測與部署 :: 2025 iThome 鐵人賽

Hazel (hazel1234)

iT邦新手 5 級 ‧ 點數 224

n/APlatform Engineer 中央大學資訊管理系

10869

累計瀏覽數

站內簡訊追蹤

鐵人檔案

2025 iThome 鐵人賽

回列表

DevOps

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列

這次的鐵人賽，我想用「ML領域超級初學者」的角度，記錄我在摸索 LLMOps 的過程。
「LLMOps」聽起來很專業，但簡單來說，就是 ------ 如何把大語言模型 (LLM) 放到實際專案裡，並且能穩定、便宜又可控地跑起來。

因為我本身有一點 DevOps 的背景，所以會把這個系列寫成「實驗筆記」的形式：
每天試一個小主題，我會把程式碼都放在文章和 GitHub Repo 上，讓讀文章的人可以跟著一起練習，而不只是看概念。因為不是 ML 專家等級的文獻，文中不會過多的探究模型之間的差異性，如果讀者有興趣的話，可以自行深入探究，這邊的模型僅供學習參考。

參賽天數 25 天｜共 25 篇文章｜ 2 人訂閱訂閱系列文 RSS系列文

0 Like 0 留言 75 瀏覽

DAY 21

Day21 - LLM 應用快取實戰：成本改善 × 加速回應

🔹 前言昨天我們談到品質監控與幻覺偵測，就算模型輸出的答案正確，還要確保它「可靠、可信」。但即使模型回答正確，還有一個現實問題： 👉 為什麼我的 LLM...

2025-10-05 ‧ 由 Hazel 分享

0 Like 0 留言 90 瀏覽

DAY 22

Day22 - LLM 與知識庫的版本控制中心：Model Registry

🔹 前言昨天我們談到 Cache 與回應加速，解決了「同一問題反覆查詢」造成的延遲與成本浪費。但 LLM 應用還有另一個大挑戰： 👉 模型與知識庫版本要怎麼...

2025-10-06 ‧ 由 Hazel 分享

0 Like 0 留言 102 瀏覽

DAY 23

Day23 - 讓 LLM 應用與時俱進：RAG 增量 × Fine-tuning 部署與治理指南

🔹 前言昨天（Day22）我們談到 Registry（模型／知識庫版本管理），確保任何時候線上跑的都是唯一正確的版本，並且升級、回滾都有紀錄可查。然而，現實世...

2025-10-07 ‧ 由 Hazel 分享

0 Like 0 留言 30 瀏覽

DAY 24

Day24 - LLM 應用分流：用任務分類做到省錢可靠

🔹 前言 Day 21 我們用快取把重複查詢變快、變省； Day 22 有了 Registry，管理不同模型與知識版本； Day 23 談了再訓練與持續學...

2025-10-08 ‧ 由 Hazel 分享

0 Like 0 留言 24 瀏覽

DAY 25

Day25 - LLM 應用安全：OWASP Guardrails 防 Prompt Injection 與資料外洩（含實測）

🔹 前言在 Day21–Day24，我們已經讓系統更快、可回滾、能再訓練，並且具備多模型路由的能力。但功能之外，還有另一個不可忽視的挑戰：安全性。接...

2025-10-09 ‧ 由 Hazel 分享

Hazel的鐵人檔案

Hazel的收藏

Hazel的追蹤

Hazel的Like

Hazel的紀錄

Hazel的訂閱列表