iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
生成式 AI

從 RAG 到 Agentic RAG:30 天打造本機智慧檢索系統 系列

30天打造一個「能找、能想、可監控」的地端智慧檢索系統:從最小 RAG Baseline 出發,逐步加入 chunk 策略、Embedding Pipeline、向量庫比較、Hybrid + Rerank、Agent 工具化(ReAct, MRKL)與多步推理,再建立評估框架與監控儀表( Langfuse),最後整合為可部署 Demo。

參賽天數 14 天 | 共 14 篇文章 | 6 人訂閱 訂閱系列文 RSS系列文 團隊躺平的內捲小隊
DAY 1

Day 1: 為什麼要還要寫RAG? 又為什麼要從 RAG 到 Agentic RAG?

🔍 為什麼要寫這個系列? Hi 我是Seedfood,是一名DA轉DS轉MLE再轉AI的雜技Data人。 今年在強者我朋友們的力推下,勇敢地參加了這屆的鐵人賽,...

2025-09-15 ‧ 由 seedfood 分享
DAY 2

Day 2: 為什麼要還要寫RAG? Fine-Tuning不香嗎?

在上一篇導論中,我們提到因簡單的RAG不足以處理實務問題,且有機敏資料你希望保護,所以需要在地端建立AgenticRAG。那就會有人問: "那為什麼公...

2025-09-16 ‧ 由 seedfood 分享
DAY 3

Day 3: 資料處理與知識庫模組-PDF parsing與Chunking

在前一篇文章的最後面,我們介紹了 RAG 的架構分層有分為 1. 資料處理與知識庫模組和 2. 使用者查詢與生成模組。接下來,我們要開始進入資料處理與知識庫模組...

2025-09-17 ‧ 由 seedfood 分享
DAY 4

Day 4: 為什麼要做 Embedding? 又為什麼重要?

當我們在做 RAG 的時候,要能找到使用者問題和正確的參考知識,靠的是 語意搜尋 (semantic search)。這背後的關鍵,就是把文字轉換成向量,將語意...

2025-09-18 ‧ 由 seedfood 分享
DAY 5

Day 5: 向量資料庫很重要嗎?可以怎麼挑呢?

🔍 向量資料庫 (Vector Database) 為何重要? 在 RAG 系統中,找到「語意最接近的知識片段」是核心,然而昨日文章有提到,要做語意檢索,其實是...

2025-09-19 ‧ 由 seedfood 分享
DAY 6

Day 6:解析繁中檔案的前置準備-Tesseract OCR

在我們開始實作 RAG 系統之前,首先要先安裝好相關套件,尤其是我們的第一步是處理 知識文件的任務,許多PDF處理工具需要用到OCR相關技術,會有一些比較特別的...

2025-09-20 ‧ 由 seedfood 分享
DAY 7

Day 7: 資料處理與知識庫模組實作-將繁中文件解析、向量化、並存入ChromaDB

前言 昨天我們先把需要的套件都安裝起來,今天要做的就是實際跑程式,將一份檔案處理完存入向量資料庫。今天文章主要分下面幾段: PDF Parsing Chunk...

2025-09-21 ‧ 由 seedfood 分享
DAY 8

Day 8 - 實作補充: RAG中的 AG- Augmented Generation

前言 昨天的步驟是Retrieval,也就是「找回相關資料」,而完整的RAG,還需要 用這些資料產生回答, 也就是 RAG 中的 Augmented, Gen...

2025-09-22 ‧ 由 seedfood 分享
DAY 9

Day 9 - RAG 進階優化-1:Hybrid Search

🔍為什麼需要 Hybrid Search? 讀者到這邊多少都有感覺到,其實目前介紹RAG的檢索階段就是以前的搜尋引擎,只是搜尋方法為 向量相似度搜尋(Vecto...

2025-09-23 ‧ 由 seedfood 分享
DAY 10

Day 10-RAG 進階優化-2:Rerank

前言 在昨天天的內容裡,我們已經介紹了 Dense Retrieval 與 Sparse Retrieval,以及並透過 Hybrid Search 把兩者結合...

2025-09-24 ‧ 由 seedfood 分享