30天打造一個「能找、能想、可監控」的地端智慧檢索系統:從最小 RAG Baseline 出發,逐步加入 chunk 策略、Embedding Pipeline、向量庫比較、Hybrid + Rerank、Agent 工具化(ReAct, MRKL)與多步推理,再建立評估框架與監控儀表( Langfuse),最後整合為可部署 Demo。
前言 我們都知道LLM會有幻覺現象,RAG的其中一作用就是要避免LLM胡說八道。但你怎麼知道你的RAG真的沒有在胡說八道呢?因此就像所有AI模型一樣,評估指標...
前言 在前面的實作中,我們的檢索流程是 「向量檢索 → 直接輸入 LLM」。 經過前幾篇的文章介紹,我們了解到可以透過hybrid search和Rerank來...
前言 在過去幾天,我們已經完成了 文件解析、向量檢索、Hybrid Search、Rerank 等功能。 今天我們要先思考 如何把這些功能整合成一個模組。後面我...
前言 經過昨天的模組介紹,相信大家對於RAG的程式組成有更清楚的概念,為了讓程式拆的更清楚,今天我們針對模組架構再做更細的拆分,並附上一個Streamlit的d...
前言 在完成了基礎的 RAG 架構後,接下來我們一項重點是:如何在地端運行 LLM(Large Language Model)? 目前常見的佈署工具包含 Oll...
前言 先前我們在Day 5: 向量資料庫很重要嗎?可以怎麼挑呢?有做過基本的向量資料庫介紹,接下來的程式會有比較多使用到Qdrant的部分,因此我們在這個章節想...
前言 前面的文章我們介紹了各項RAG的架構,以及可以用來優化RAG的方法,但實務上基本的RAG,其實是會遇到許多瓶頸的! 例如檢索僅有單輪、複雜問題需要推理、或...
前言 昨天的文章介紹到我們需要使用Agentic RAG來讓我們的RAG系統更聰明,並解決多輪思考或工具調用的瓶頸,也介紹到Agentic RAG其實就是透過A...
前言 昨日的文章介紹了各項Agent flow,其中筆者目前主要使用的框架為MRKL系統,今天就一起來認識一下這個神奇的框架吧! 🧩MRKL背景知識 MRKL...
前言 在我們繼續往Agentic RAG前進前,筆者想先補充一個RAG場景常遇到的痛點-Retrieval找不回正確的資料,這個問題會導致RAG系統參考不到正確...