iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
生成式 AI

從 RAG 到 Agentic RAG:30 天打造本機智慧檢索系統 系列

30天打造一個「能找、能想、可監控」的地端智慧檢索系統:從最小 RAG Baseline 出發,逐步加入 chunk 策略、Embedding Pipeline、向量庫比較、Hybrid + Rerank、Agent 工具化(ReAct, MRKL)與多步推理,再建立評估框架與監控儀表( Langfuse),最後整合為可部署 Demo。

鐵人鍊成 | 共 30 篇文章 | 8 人訂閱 訂閱系列文 RSS系列文 團隊躺平的內捲小隊
DAY 11

Day 11: 我的RAG到底行不行啊?RAG的評估指標介紹(檢索與生成篇)

前言 我們都知道LLM會有幻覺現象,RAG的其中一作用就是要避免LLM胡說八道。但你怎麼知道你的RAG真的沒有在胡說八道呢?因此就像所有AI模型一樣,評估指標...

2025-09-25 ‧ 由 seedfood 分享
DAY 12

Day 12: 實作調整:加入Rerank model

前言 在前面的實作中,我們的檢索流程是 「向量檢索 → 直接輸入 LLM」。 經過前幾篇的文章介紹,我們了解到可以透過hybrid search和Rerank來...

2025-09-26 ‧ 由 seedfood 分享
DAY 13

Day 13: 用 Streamlit 打造互動式 RAG Demo

前言 在過去幾天,我們已經完成了 文件解析、向量檢索、Hybrid Search、Rerank 等功能。 今天我們要先思考 如何把這些功能整合成一個模組。後面我...

2025-09-27 ‧ 由 seedfood 分享
DAY 14

Day 14: 模組擴充與Streamlit Demo程式

前言 經過昨天的模組介紹,相信大家對於RAG的程式組成有更清楚的概念,為了讓程式拆的更清楚,今天我們針對模組架構再做更細的拆分,並附上一個Streamlit的d...

2025-09-28 ‧ 由 seedfood 分享
DAY 15

Day 15: 在地端運行 LLM:Ollama、vLLM 與 llama.cpp 比較以及ollama安裝

前言 在完成了基礎的 RAG 架構後,接下來我們一項重點是:如何在地端運行 LLM(Large Language Model)? 目前常見的佈署工具包含 Oll...

2025-09-29 ‧ 由 seedfood 分享
DAY 16

Day 16:向量資料庫進階分析: Qdrant

前言 先前我們在Day 5: 向量資料庫很重要嗎?可以怎麼挑呢?有做過基本的向量資料庫介紹,接下來的程式會有比較多使用到Qdrant的部分,因此我們在這個章節想...

2025-09-30 ‧ 由 seedfood 分享
DAY 17

Day 17: 大家都在Agent,那你知道什麼是Agentic RAG嗎?

前言 前面的文章我們介紹了各項RAG的架構,以及可以用來優化RAG的方法,但實務上基本的RAG,其實是會遇到許多瓶頸的! 例如檢索僅有單輪、複雜問題需要推理、或...

2025-10-01 ‧ 由 seedfood 分享
DAY 18

Day 18:什麼! AI Agent 也有分哦! Agent flow介紹

前言 昨天的文章介紹到我們需要使用Agentic RAG來讓我們的RAG系統更聰明,並解決多輪思考或工具調用的瓶頸,也介紹到Agentic RAG其實就是透過A...

2025-10-02 ‧ 由 seedfood 分享
DAY 19

Day 19: AI Agent為何如此神奇? 一起來認識MRKL (唸Miracle)

前言 昨日的文章介紹了各項Agent flow,其中筆者目前主要使用的框架為MRKL系統,今天就一起來認識一下這個神奇的框架吧! 🧩MRKL背景知識 MRKL...

2025-10-03 ‧ 由 seedfood 分享
DAY 20

Day 20: RAG無法找回正確的資料該怎麼辦? 淺談embedding model fine-tuning

前言 在我們繼續往Agentic RAG前進前,筆者想先補充一個RAG場景常遇到的痛點-Retrieval找不回正確的資料,這個問題會導致RAG系統參考不到正確...

2025-10-04 ‧ 由 seedfood 分享