30天打造一個「能找、能想、可監控」的地端智慧檢索系統:從最小 RAG Baseline 出發,逐步加入 chunk 策略、Embedding Pipeline、向量庫比較、Hybrid + Rerank、Agent 工具化(ReAct, MRKL)與多步推理,再建立評估框架與監控儀表( Langfuse),最後整合為可部署 Demo。
前言 我們都知道LLM會有幻覺現象,RAG的其中一作用就是要避免LLM胡說八道。但你怎麼知道你的RAG真的沒有在胡說八道呢?因此就像所有AI模型一樣,評估指標...
前言 在前面的實作中,我們的檢索流程是 「向量檢索 → 直接輸入 LLM」。 經過前幾篇的文章介紹,我們了解到可以透過hybrid search和Rerank來...
前言 在過去幾天,我們已經完成了 文件解析、向量檢索、Hybrid Search、Rerank 等功能。 今天我們要先思考 如何把這些功能整合成一個模組。後面我...
前言 經過昨天的模組介紹,相信大家對於RAG的程式組成有更清楚的概念,為了讓程式拆的更清楚,今天我們針對模組架構再做更細的拆分,並附上一個Streamlit的d...