Day 1：為什麼要還要寫RAG? 又為什麼要從 RAG 到 Agentic RAG?

2025 iThome 鐵人賽

DAY 1

生成式 AI

從 RAG 到 Agentic RAG：30 天打造本機智慧檢索系統系列第 1 篇

17th鐵人賽 rag ai agent

seedfood

團隊躺平的內捲小隊

2025-09-15 21:02:59

1344 瀏覽

分享至

🔍 為什麼要寫這個系列？

Hi 我是Seedfood，是一名DA轉DS轉MLE再轉AI的雜技Data人。

今年在強者我朋友們的力推下，勇敢地參加了這屆的鐵人賽，希望把過去2年在做RAG的一些心路歷程做一些回顧和分享，也訓練自己輸出的能力。

在這個號稱10個工程師有11個會RAG的年代(第11個是PM)，我經常遇到所謂RAG的經驗就是embedding打OpenAI、LLM打OpenAI、甚至現在還有解析檔案也直接打OpenAI，所以連Chunk都不用管，因為Context window真的夠大。可是如果你的資料不想外洩，你需要在地端建立真的動手建一套知識系統，那該怎麼做?又有多少坑需要踩過爬出呢?

筆者現在就是掉在坑內的一員，希望這次的系列能夠釣出一些已經從坑裡爬出的大大，解救還在坑內或準備跳入坑中的朋友們。

🤖 什麼是「RAG」，又為什麼要「Agentic RAG」？

如同前述，這兩年RAG（Retrieval-Augmented Generation）幾乎成為 建構 AI 系統的標配。
它的基本思路很簡單：

檢索：從知識庫中找到最相關的內容
生成：把檢索結果交給 LLM 來生成答案

而中間當然還有許多技術細節，例如你的知識要轉換成向量，幫助系統更好的找到和使用者提問最相關的內容，因此需要embedding，而為了要存向量，因此你需要向量資料庫，相關的細節在這系列的文章都會提到。

由於RAG的應用簡單易懂，因此要完成一個PoC其實是不困難的，然而，當 RAG 被真正應用在實務場景時，問題就浮現了：

查不到 → 答不出來：單次檢索無法覆蓋複雜問題
相關 ≠ 正確：檢索回來的內容可能冗餘或誤導，導致幻覺
無法分工：遇到需要計算、邏輯推理、多步驟思考時，RAG 無能為力

這也是為什麼我們需要走向 Agentic RAG。

所謂 Agentic RAG，就是在傳統 RAG 架構上，加入 Agent 思維與工具使用能力。
它不再是單純的「檢索 → 回答」，而是可以：

分解問題 → 拆成子問題，逐步查找與回答
使用工具 → 不只依靠檢索，還能呼叫計算、路由、甚至外部 API
多步推理 → 根據中間結果，決定下一步行動，直到完成任務

有了上面的能力，Agentic RAG 才比較能夠在真實應用場景中落地，實際上Agent就是一個趨勢，而RAG會是Agent最得力的工具之一。

🗂️ 這個系列會怎麼進行？

為了讓整個旅程更有結構，我會將 30 天拆成 4 個週次，並且採取「知識導讀 + 實作體驗」的方式。

知識導讀（5~6 天）：每天針對該週核心技術主題撰寫，整理概念、架構或是比較（偏向技術筆記）。
實作驗證（1–2 天）：動手跑一個最小可行版本，把學到的知識轉化成能運行的程式，同時做一些測試與驗證。

進度安排如下：

📌 Week 1（09/15–09/21）：Baseline 打底

目標：建立一個 最小可行的 RAG 系統
重點：RAG 架構、chunking 策略、embedding 模型比較、向量資料庫比較
實作：預計使用 OpenAI API + Chroma + PDF parsing，完成第一個能跑的 pipeline

📌 Week 2（09/22–09/28）：Retrieval 強化

目標：解決檢索不足與準確率問題
重點：Hybrid search、Reranker、本地 LLM 部署
實作：預計使用** Qdrant + 本地模型(預計使用Llama 8B)**，並測試複雜問題

📌 Week 3（09/29–10/05）：Agent 化

目標：讓系統能 思考與行動
重點：Agent 類型、工具化、ReAct、Self-Ask、MRKL、多步推理
實作：在地端建立一個具備「檢索 + 工具使用」的 Agent，預計使用MRKL框架，搭配Qdrant以及本地模型gpt-oss-20b

📌 Week 4（10/06–10/15）：監控與優化

目標：讓系統能被 監控、評估、部署
重點：Prometheus/Grafana、Langfuse、評估框架、幻覺處理、Streamlit UI、Caching、PQ/壓縮
實作：用 Docker Compose 打包完整系統

🎯 最終成果

在第 30 天結束時，這個系列將交付：

一個 從 API 串接到本地 LLM 部署的完整 Agentic RAG 系統
一套 監控與評估框架，包含延遲、準確度與幻覺率指標
如果可以，也希望能提供:
一份 踩雷清單，幫助後續延伸開發

時間允許的話：

向量資料庫管理 Pipeline：向量資料庫的定期刷新與維護知識庫
多模態 RAG：支援文字、圖片、文件混合檢索的初步研究
GenBI: RAG與結構型資料的合作

📢 準備開賽

這是一場從 「簡單 RAG」→「Agentic RAG」→「可監控與部署的完整系統」 的旅程。
如果你曾經因為 RAG 成效不如預期而感到挫折，或是PoC完後看到老闆很開心但心理糾結要不要做，那麼希望這個系列能和你一起看到 如何一步步填坑讓PoC落地，建構一個能在實務場景中真正發揮作用的RAG應用系統。