🔹 前言 過去幾年,大家談 MLOps(Machine Learning Operations)時,重點都放在「如何讓機器學習模型可以產品化與維運」。 但隨著...
🔹 前言 通常工程師們在接到新任務的時候會由 PM (Product Manager) 產生 PRD。今天,我們也要照這個流程,先來釐清「為什麼」要做這個專案,...
🔹 前言 昨天(Day 2)我們扮演了 PM,把專案的需求、目標和架構拆解清楚。 今天開始,就要進入實作階段了,專案程式碼已放在 GitHub,之後如果有 De...
🔹 前言 在 LLMOps 的世界裡,向量資料庫 (Vector Database) 幾乎是 RAG(Retrieval-Augmented Generatio...
🔹 前言 昨天 (Day 4) 我們比較了 向量資料庫,解決了「知識要存在哪裡,怎麼檢索」的問題。 但在 RAG (Retrieval-Augmented Ge...
🔹 前言 前兩天我們分別搞定了 RAG 的兩個基礎拼圖: Day 4 向量資料庫 → 負責「存資料」以及「找尋片段」 Day 5 Embedding 模型...
🔹 前言 昨天 (Day 6) 我們第一次跑出 Minimal RAG QA Bot,流程是: 使用者提問 → Embedding → 檢索 → LLM 回答。...
🔹 前言 昨天我們做了一個最小可行的 QA Bot,但知識庫的單位是「整句 FAQ」,格式非常乾淨。 然而真實情況下,文件來源可能包含: Word / PDF...
🔹 前言 昨天(Day 8)我們完成了兩件重要的事: 文件清洗 (Cleaning) → 把雜訊、廣告、過長段落處理乾淨,確保知識來源乾淨。 文件切片 (...
🔹 前言 昨天(Day 9)我們已經完成了 文件向量化 和 索引建立,現在我們擁有一個能快速查詢的向量資料庫。 但光靠索引檢索出來的結果,往往只是一個「初步的...