從 RAG 到 Agentic RAG：30 天打造本機智慧檢索系統 :: 2025 iThome 鐵人賽

seedfood (seedfood)

iT邦新手 5 級 ‧ 點數 138

4470

累計瀏覽數

站內簡訊追蹤

鐵人檔案

2025 iThome 鐵人賽

回列表

生成式 AI

從 RAG 到 Agentic RAG：30 天打造本機智慧檢索系統系列

30天打造一個「能找、能想、可監控」的地端智慧檢索系統：從最小 RAG Baseline 出發，逐步加入 chunk 策略、Embedding Pipeline、向量庫比較、Hybrid + Rerank、Agent 工具化(ReAct, MRKL)與多步推理，再建立評估框架與監控儀表（ Langfuse），最後整合為可部署 Demo。

鐵人鍊成｜共 30 篇文章｜ 15 人訂閱訂閱系列文 RSS系列文｜團隊躺平的內捲小隊

3 Like 1 留言 1229 瀏覽

DAY 1

Day 1：為什麼要還要寫RAG? 又為什麼要從 RAG 到 Agentic RAG?

🔍 為什麼要寫這個系列？ Hi 我是Seedfood，是一名DA轉DS轉MLE再轉AI的雜技Data人。今年在強者我朋友們的力推下，勇敢地參加了這屆的鐵人賽，...

2025-09-15 ‧ 由 seedfood 分享

2 Like 0 留言 951 瀏覽

DAY 2

Day 2：為什麼要還要寫RAG? Fine-Tuning不香嗎?

在上一篇導論中，我們提到因簡單的RAG不足以處理實務問題，且有機敏資料你希望保護，所以需要在地端建立AgenticRAG。那就會有人問: "那為什麼公...

2025-09-16 ‧ 由 seedfood 分享

2 Like 0 留言 1049 瀏覽

DAY 3

Day 3：資料處理與知識庫模組-PDF parsing與Chunking

在前一篇文章的最後面，我們介紹了 RAG 的架構分層有分為 1. 資料處理與知識庫模組和 2. 使用者查詢與生成模組。接下來，我們要開始進入資料處理與知識庫模組...

2025-09-17 ‧ 由 seedfood 分享

2 Like 0 留言 2742 瀏覽

DAY 4

Day 4: 為什麼要做 Embedding? 又為什麼重要?

當我們在做 RAG 的時候，要能找到使用者問題和正確的參考知識，靠的是語意搜尋 (semantic search)。這背後的關鍵，就是把文字轉換成向量，將語意...

2025-09-18 ‧ 由 seedfood 分享

2 Like 0 留言 1203 瀏覽

DAY 5

Day 5：向量資料庫很重要嗎?可以怎麼挑呢?

🔍 向量資料庫 (Vector Database) 為何重要？在 RAG 系統中，找到「語意最接近的知識片段」是核心，然而昨日文章有提到，要做語意檢索，其實是...

2025-09-19 ‧ 由 seedfood 分享

2 Like 0 留言 2263 瀏覽

DAY 6

Day 6：解析繁中檔案的前置準備-Tesseract OCR

在我們開始實作 RAG 系統之前，首先要先安裝好相關套件，尤其是我們的第一步是處理知識文件的任務，許多PDF處理工具需要用到OCR相關技術，會有一些比較特別的...

2025-09-20 ‧ 由 seedfood 分享

1 Like 0 留言 1087 瀏覽

DAY 7

Day 7: 資料處理與知識庫模組實作-將繁中文件解析、向量化、並存入ChromaDB

前言昨天我們先把需要的套件都安裝起來，今天要做的就是實際跑程式，將一份檔案處理完存入向量資料庫。今天文章主要分下面幾段: PDF Parsing Chunk...

2025-09-21 ‧ 由 seedfood 分享

1 Like 0 留言 686 瀏覽

DAY 8

Day 8 - 實作補充: RAG中的 AG- Augmented Generation

前言昨天的步驟是Retrieval，也就是「找回相關資料」，而完整的RAG，還需要用這些資料產生回答，也就是 RAG 中的 Augmented, Gen...

2025-09-22 ‧ 由 seedfood 分享

0 Like 0 留言 1766 瀏覽

DAY 9

Day 9 - RAG 進階優化-1：Hybrid Search

🔍為什麼需要 Hybrid Search？讀者到這邊多少都有感覺到，其實目前介紹RAG的檢索階段就是以前的搜尋引擎，只是搜尋方法為向量相似度搜尋（Vecto...

2025-09-23 ‧ 由 seedfood 分享

0 Like 0 留言 1817 瀏覽

DAY 10

Day 10-RAG 進階優化-2：Rerank

前言在昨天天的內容裡，我們已經介紹了 Dense Retrieval 與 Sparse Retrieval，以及並透過 Hybrid Search 把兩者結合...

2025-09-24 ‧ 由 seedfood 分享

seedfood的鐵人檔案

seedfood的收藏

seedfood的追蹤

seedfood的Like

seedfood的紀錄

seedfood的訂閱列表