iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
DevOps

30 天帶你實戰 LLMOps:從 RAG 到觀測與部署 系列

這次的鐵人賽,我想用 「ML領域超級初學者」 的角度,記錄我在摸索 LLMOps 的過程。
「LLMOps」 聽起來很專業,但簡單來說,就是 ------ 如何把大語言模型 (LLM) 放到實際專案裡,並且能穩定、便宜又可控地跑起來。

因為我本身有一點 DevOps 的背景,所以會把這個系列寫成「實驗筆記」的形式:
每天試一個小主題,我會把程式碼都放在文章和 GitHub Repo 上,讓讀文章的人可以跟著一起練習,而不只是看概念。因為不是 ML 專家等級的文獻,文中不會過多的探究模型之間的差異性,如果讀者有興趣的話,可以自行深入探究,這邊的模型僅供學習參考。

參賽天數 4 天 | 共 4 篇文章 | 2 人訂閱 訂閱系列文 RSS系列文
DAY 1

Day01 - 為什麼需要 LLMOps?與傳統 MLOps 差異

🔹 前言 過去幾年,大家談 MLOps(Machine Learning Operations)時,重點都放在「如何讓機器學習模型可以產品化與維運」。 但隨著...

2025-09-15 ‧ 由 Hazel 分享
DAY 2

Day02 - 系列專案介紹:企業知識庫 QA Chatbot

🔹 前言 通常工程師們在接到新任務的時候會由 PM (Product Manager) 產生 PRD。今天,我們也要照這個流程,先來釐清「為什麼」要做這個專案,...

2025-09-16 ‧ 由 Hazel 分享
DAY 3

Day03 - 環境準備:Docker + Conda

🔹 前言 昨天(Day 2)我們扮演了 PM,把專案的需求、目標和架構拆解清楚。 今天開始,就要進入實作階段了,專案程式碼已放在 GitHub,之後如果有 De...

2025-09-17 ‧ 由 Hazel 分享
DAY 4

Day04 - 向量資料庫(Vector Database)- 常見選項與實務比較

🔹 前言 在 LLMOps 的世界裡,向量資料庫 (Vector Database) 幾乎是 RAG(Retrieval-Augmented Generatio...

2025-09-18 ‧ 由 Hazel 分享