iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

3 Like 0 留言 569 瀏覽

鐵人賽 DevOps

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 34 篇

技術 Day34 - 番外篇：需要微調嗎？從 DevOps 角度評估生產部署

（文中有彩蛋 🥚 還記得 Day31 的前輩教我們要仔細評估技術選型嗎？為什麼場景裡的 SRE 會回答 $1-3K 每個月呢？） 🔹 前言回顧 LoRA 微調...

Hazel ‧ 2025-10-27

0 Like 0 留言 584 瀏覽

鐵人賽 DevOps

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 33 篇

技術 Day33 - 進階篇：LoRA 微調失敗 N 次才成功？踩坑血淚史

🔹 前言在 Day32 - 進階篇：Mac M3 本機 LoRA 微調 Qwen2.5 （30 分鐘，準確率 92%）我完成了 LoRA 微調流程，最終用...

Hazel ‧ 2025-10-24

0 Like 0 留言 1356 瀏覽

鐵人賽 DevOps

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 32 篇

技術 Day32 - 進階篇：Macbook Air M3 本機 LoRA 微調 Qwen2.5（30 分鐘，相似度 92%）

📝 TL;DR > 本文示範如何在 M3 本機完成 LoRA 微調（訓練 30 分鐘），採用 CPU 示範確保通用性，M3 可用 MPS/MLX 加速。...

Hazel ‧ 2025-10-23

0 Like 0 留言 830 瀏覽

鐵人賽 DevOps DAY 30

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 30 篇

技術 Day30 - 從 62% 到 75%+：Production Readiness 的最後一哩路

🔹 第 30 天只是一個開始這系列是我 9/4 起床時腦中靈光一閃決定要寫的。當我在 Day 1 決定最後目標是要做「一個企業知識庫 FAQ Chatbot...

Hazel ‧ 2025-10-14

0 Like 0 留言 609 瀏覽

鐵人賽 DevOps DAY 29

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 29 篇

技術 Day29 - RAG FAQ Chatbot 實戰案例 III：部署、連通、觀測與成本驗證

🔹 前言 Day28 做完了環境評估以及串接測試後，今天我們會實際把程式部署到 AWS 上面，看看整條路徑能不能撐得住。首先把應用程式部署到 AWS EC2，...

Hazel ‧ 2025-10-13

0 Like 1 留言 342 瀏覽

鐵人賽 DevOps DAY 28

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 28 篇

技術 Day28 - RAG FAQ Chatbot 實戰案例 II：Cloudflare + AWS 低成本架構與完整試算

🔹 前言 ⚠️ 提醒：這篇文章是完整的雲端環境評估記錄。內容會涵蓋成本試算、安全權衡、部署方式等細節，屬於「實務考量」的展開。本文適合「想控制雲端成本」且...

Hazel ‧ 2025-10-12

0 Like 0 留言 400 瀏覽

鐵人賽 DevOps DAY 27

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 27 篇

技術 Day27 - RAG FAQ Chatbot 實戰案例 I：功能驗收全紀錄（檢索 × 快取 × 安全 × 監控）

🔹 前言經過前 26 天對於 RAG 以及對於 LLMOps 的各面向的學習，終於來到實作以及驗收這個 RAG FAQ Chatbot 的階段。今天的目標就是...

Hazel ‧ 2025-10-11

0 Like 0 留言 230 瀏覽

鐵人賽 DevOps DAY 26

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 26 篇

技術 Day26 - LLM 應用成本改善：如何採用 MVP 三步驟節省 40% 成本？

🔹 前言在過去幾天的章節中，我們逐步建立起一套可觀測、安全可靠、有效率的 LLM 應用基礎： Day 19 — 延遲、Token 與成本觀測：透過指標化（...

Hazel ‧ 2025-10-10

0 Like 0 留言 336 瀏覽

鐵人賽 DevOps DAY 25

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 25 篇

技術 Day25 - LLM 應用安全：OWASP Guardrails 防 Prompt Injection 與資料外洩（含實測）

🔹 前言在 Day21–Day24，我們已經讓系統更快、可回滾、能再訓練，並且具備多模型路由的能力。但功能之外，還有另一個不可忽視的挑戰：安全性。接...

Hazel ‧ 2025-10-09

0 Like 0 留言 267 瀏覽

鐵人賽 DevOps DAY 24

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 24 篇

技術 Day24 - LLM 應用分流：用任務分類做到省錢可靠

🔹 前言 Day 21 我們用快取把重複查詢變快、變省； Day 22 有了 Registry，管理不同模型與知識版本； Day 23 談了再訓練與持續學...

Hazel ‧ 2025-10-08

0 Like 0 留言 500 瀏覽

鐵人賽 DevOps DAY 23

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 23 篇

技術 Day23 - 讓 LLM 應用與時俱進：RAG 增量 × Fine-tuning 部署與治理指南

🔹 前言昨天（Day22）我們談到 Registry（模型／知識庫版本管理），確保任何時候線上跑的都是唯一正確的版本，並且升級、回滾都有紀錄可查。然而，現實世...

Hazel ‧ 2025-10-07

0 Like 0 留言 311 瀏覽

鐵人賽 DevOps DAY 22

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 22 篇

技術 Day22 - LLM 與知識庫的版本控制中心：Model Registry

🔹 前言昨天我們談到 Cache 與回應加速，解決了「同一問題反覆查詢」造成的延遲與成本浪費。但 LLM 應用還有另一個大挑戰： 👉 模型與知識庫版本要怎麼...

Hazel ‧ 2025-10-06

0 Like 0 留言 313 瀏覽

鐵人賽 DevOps DAY 21

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 21 篇

技術 Day21 - LLM 應用快取實戰：成本改善 × 加速回應

🔹 前言昨天我們談到品質監控與幻覺偵測，就算模型輸出的答案正確，還要確保它「可靠、可信」。但即使模型回答正確，還有一個現實問題： 👉 為什麼我的 LLM...

Hazel ‧ 2025-10-05

0 Like 0 留言 385 瀏覽

鐵人賽 DevOps DAY 20

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 20 篇

技術 Day20 - LLM 回應品質監控：幻覺偵測與三層防護實作

🔹 前言昨天我們談到延遲、Token 與成本的監控，確保系統「跑得快、花得省」。但如果模型輸出的答案是錯的呢？ 👉 在 LLM 應用中，Hallucin...

Hazel ‧ 2025-10-04

0 Like 0 留言 257 瀏覽

鐵人賽 DevOps DAY 19

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 19 篇

技術 Day19 - LLM 可觀測性實戰：監控延遲、Token 與成本(含工具選型)

🔹 前言昨天我們完成了 API Gateway，讓前端可以透過一個統一的 Proxy 來存取 LLM。但在真實運行環境裡，還有一個非常現實的問題： 👉 我的...

Hazel ‧ 2025-10-03

0 Like 0 留言 436 瀏覽

鐵人賽 DevOps DAY 18

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 18 篇

技術 Day18 - 用 FastAPI 實作 LLM API Gateway：驗證、限流、觀測與實務選型

🔹 前言經過前面系列的文章，我們已經從零搭建出一條完整的 RAG Pipeline ，目前具備以下能力：文件清洗與 Chunking 把原始文件整理成乾...

Hazel ‧ 2025-10-02

0 Like 0 留言 290 瀏覽

鐵人賽 DevOps DAY 17

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 17 篇

技術 Day17 - LLM 部署策略選型：雲端 vs 本地 vs 混合架構（成本與隱私）

🔹 前言前 16 天，我們一路鋪陳了基礎觀念：從 RAG 檢索架構、快取、觀測性、Prompt 設計到 Workflow 工具（LangChain + G...

Hazel ‧ 2025-10-01

0 Like 0 留言 768 瀏覽

鐵人賽 DevOps DAY 16

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 16 篇

技術 Day16 - LangChain × Guidance：打造可組合、可控的 Prompt 工作流

🔹 前言昨天我們談到 Prompt 系統化：包括模板化、版本管理、測試與整合。這些設計，讓我們能像管理程式碼一樣管理 Prompt。但在真實應用中，單一 P...

Hazel ‧ 2025-09-30

0 Like 0 留言 310 瀏覽

鐵人賽 DevOps DAY 15

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 15 篇

技術 Day15 - Prompt Generation：用模板和版本管理 Prompt，規範 LLM 的回應

🔹 前言在使用 LLM（大型語言模型）的時候，我們其實是透過一段「指令」來告訴模型要做什麼，這段指令就叫做提示詞（Prompt）。在 Day 15 &a...

Hazel ‧ 2025-09-29

0 Like 0 留言 558 瀏覽

鐵人賽 DevOps DAY 14

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 14 篇

技術 Day14 - LLMOps Pipeline 自動化：Prefect vs Dagster 實戰比較

🔹 前言終於來到和 DevOps 這個主題比較相關的部分了，感謝前面有耐心跟著讀的讀者 😆 在 RAG 系統裡，我們需要週期性地做很多「重複又必要」的工作來讓...

Hazel ‧ 2025-09-28

0 Like 0 留言 206 瀏覽

鐵人賽 DevOps DAY 13

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 13 篇

技術 Day13 - 為什麼知識會「過期」？Data Drift 偵測與更新策略實作

🔹 前言昨天（Day 12）我們談到了知識庫資料管理：多種來源整合 → 把 PDF、Web、API 等不同來源轉換成統一格式。資料版本控制 → 用 D...

Hazel ‧ 2025-09-27

0 Like 0 留言 286 瀏覽

鐵人賽 DevOps DAY 12

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 12 篇

技術 Day12 - 知識庫資料管理：多來源整合 × 可追溯版本控制

🔹 前言經過前幾天（Day 8–11）的實作，我們已經完成了從文件清洗 → Chunking → 向量化 → 索引 → 查詢流程 → 上下文組裝的基礎。...

Hazel ‧ 2025-09-26

0 Like 0 留言 320 瀏覽

鐵人賽 DevOps DAY 11

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 11 篇

技術 Day11 - RAG 上下文最佳化：4 種策略實測，降低 Token 成本

🔹 前言昨天（Day 10）我們把「查詢流程」串了起來： Retriever：快速找出候選文件。 Reranker：重新排序，把最相關的文件放到最前面。...

Hazel ‧ 2025-09-25

0 Like 0 留言 359 瀏覽

鐵人賽 DevOps DAY 10

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 10 篇

技術 Day10 - RAG 查詢實作：Retriever＋Reranker 與模型評測

🔹 前言昨天（Day 9）我們已經完成了文件向量化和索引建立，現在我們擁有一個能快速查詢的向量資料庫。但光靠索引檢索出來的結果，往往只是一個「初步的...

Hazel ‧ 2025-09-24

0 Like 0 留言 324 瀏覽

鐵人賽 DevOps DAY 9

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 9 篇

技術 Day09 - RAG 索引建置：向量化與 FAISS 索引實作

🔹 前言昨天（Day 8）我們完成了兩件重要的事：文件清洗 (Cleaning) → 把雜訊、廣告、過長段落處理乾淨，確保知識來源乾淨。文件切片 (...

Hazel ‧ 2025-09-23

0 Like 0 留言 533 瀏覽

鐵人賽 DevOps DAY 8

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 8 篇

技術 Day08 - RAG 資料預處理：文件清洗與 Chunking 切片策略

🔹 前言昨天我們做了一個最小可行的 QA Bot，但知識庫的單位是「整句 FAQ」，格式非常乾淨。然而真實情況下，文件來源可能包含： Word / PDF...

Hazel ‧ 2025-09-22

0 Like 0 留言 334 瀏覽

鐵人賽 DevOps DAY 7

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 7 篇

技術 Day07 - 最小可行的 RAG QA Bot（Web 版 MVP）

🔹 前言昨天 (Day 6) 我們第一次跑出 Minimal RAG QA Bot，流程是：使用者提問 → Embedding → 檢索 → LLM 回答。...

Hazel ‧ 2025-09-21

0 Like 0 留言 330 瀏覽

鐵人賽 DevOps DAY 6

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 6 篇

技術 Day06 - RAG 檢索增強生成入門：最小可行 Demo 實作

🔹 前言前兩天我們分別搞定了 RAG 的兩個基礎拼圖： Day 4 向量資料庫 → 負責「存資料」以及「找尋片段」 Day 5 Embedding 模型...

Hazel ‧ 2025-09-20

1 Like 0 留言 784 瀏覽

鐵人賽 DevOps DAY 5

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 5 篇

技術 Day05 - 向量模型（Embedding）- 四種 Embedding 模型實測與選型

🔹 前言昨天 (Day 4) 我們比較了向量資料庫，解決了「知識要存在哪裡，怎麼檢索」的問題。但在 RAG (Retrieval-Augmented Ge...

Hazel ‧ 2025-09-19

0 Like 0 留言 791 瀏覽

鐵人賽 DevOps DAY 4

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 4 篇

技術 Day04 - 向量資料庫（Vector Database）- 常見選項與實務比較

🔹 前言在 LLMOps 的世界裡，向量資料庫 (Vector Database) 幾乎是 RAG（Retrieval-Augmented Generatio...

Hazel ‧ 2025-09-18

技術 Day34 - 番外篇：需要微調嗎？從 DevOps 角度評估生產部署

技術 Day33 - 進階篇：LoRA 微調失敗 N 次才成功？踩坑血淚史

技術 Day32 - 進階篇：Macbook Air M3 本機 LoRA 微調 Qwen2.5（30 分鐘，相似度 92%）

技術 Day30 - 從 62% 到 75%+：Production Readiness 的最後一哩路

技術 Day29 - RAG FAQ Chatbot 實戰案例 III：部署、連通、觀測與成本驗證

技術 Day28 - RAG FAQ Chatbot 實戰案例 II：Cloudflare + AWS 低成本架構與完整試算

技術 Day27 - RAG FAQ Chatbot 實戰案例 I：功能驗收全紀錄（檢索 × 快取 × 安全 × 監控）

技術 Day26 - LLM 應用成本改善：如何採用 MVP 三步驟節省 40% 成本？

技術 Day25 - LLM 應用安全：OWASP Guardrails 防 Prompt Injection 與資料外洩（含實測）

技術 Day24 - LLM 應用分流：用任務分類做到省錢可靠

技術 Day23 - 讓 LLM 應用與時俱進：RAG 增量 × Fine-tuning 部署與治理指南

技術 Day22 - LLM 與知識庫的版本控制中心：Model Registry

技術 Day21 - LLM 應用快取實戰：成本改善 × 加速回應

技術 Day20 - LLM 回應品質監控：幻覺偵測與三層防護實作

技術 Day19 - LLM 可觀測性實戰：監控延遲、Token 與成本(含工具選型)

技術 Day18 - 用 FastAPI 實作 LLM API Gateway：驗證、限流、觀測與實務選型

技術 Day17 - LLM 部署策略選型：雲端 vs 本地 vs 混合架構（成本與隱私）

技術 Day16 - LangChain × Guidance：打造可組合、可控的 Prompt 工作流

技術 Day15 - Prompt Generation：用模板和版本管理 Prompt，規範 LLM 的回應

技術 Day14 - LLMOps Pipeline 自動化：Prefect vs Dagster 實戰比較

技術 Day13 - 為什麼知識會「過期」？Data Drift 偵測與更新策略實作

技術 Day12 - 知識庫資料管理：多來源整合 × 可追溯版本控制

技術 Day11 - RAG 上下文最佳化：4 種策略實測，降低 Token 成本

技術 Day10 - RAG 查詢實作：Retriever＋Reranker 與模型評測

技術 Day09 - RAG 索引建置：向量化與 FAISS 索引實作

技術 Day08 - RAG 資料預處理：文件清洗與 Chunking 切片策略

技術 Day07 - 最小可行的 RAG QA Bot（Web 版 MVP）

技術 Day06 - RAG 檢索增強生成入門：最小可行 Demo 實作

技術 Day05 - 向量模型（Embedding）- 四種 Embedding 模型實測與選型

技術 Day04 - 向量資料庫（Vector Database）- 常見選項與實務比較

標記使用者