iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
生成式 AI

從 RAG 到 Agentic RAG:30 天打造本機智慧檢索系統 系列

30天打造一個「能找、能想、可監控」的地端智慧檢索系統:從最小 RAG Baseline 出發,逐步加入 chunk 策略、Embedding Pipeline、向量庫比較、Hybrid + Rerank、Agent 工具化(ReAct, MRKL)與多步推理,再建立評估框架與監控儀表( Langfuse),最後整合為可部署 Demo。

鐵人鍊成 | 共 30 篇文章 | 8 人訂閱 訂閱系列文 RSS系列文 團隊躺平的內捲小隊
DAY 21

Day 21: 在了解MCP之前,先試試簡單的tool吧!

前言 我們在介紹在 MRKL時有提到,調用工具(Tool) 是讓模型具備「行動能力」的核心組件。 在MRKL的框架下(其實AI Agent都是如此),LLM 並...

2025-10-05 ‧ 由 seedfood 分享
DAY 22

Day 22: 將Qdrant的Retrieval包成LangChain tool

前言 在前面的章節中,我們了解了 Tool 是 LangChain Agent 調用外部能力的核心。 接下來,我們以Qdrant 向量搜尋 為例,示範如何把RA...

2025-10-06 ‧ 由 seedfood 分享
DAY 23

Day 23: 有了Agentic RAG就萬事OK嗎? 談談RAG系統的監控

前言 實務應用中,RAG(Retrieval-Augmented Generation)系統不只是「模型表現」的問題,而是一整條查詢流程的效能與穩定性問題;再加...

2025-10-07 ‧ 由 seedfood 分享
DAY 24

Day 24: 打造 RAG 系統監控基礎:Prometheus 、 Grafana以及LangSmith

前言 上一篇文章中我們討論了 RAG 至 Agentic RAG 系統中,延遲與準確度監控的重要性。 本篇我們將實際介紹兩個最常見的開源監控組合 —— Prom...

2025-10-08 ‧ 由 seedfood 分享
DAY 25

Day 25: 安裝Prometheus, Grafana於Windows系統

前言 今天先簡單說明如何建立基礎的 LLM 監控環境,我們先安裝以下: 🔥 Prometheus — 收集並儲存指標 (metrics) 🚨 Grafana...

2025-10-09 ‧ 由 seedfood 分享
DAY 26

Day 26: LLM 監控實作:用 LangSmith 建立模型追蹤與效能分析

前言 我們昨天已經安裝了Grafana和Prometheus,今天我們來讓LangSmith跑起來吧! LangSmith 是由 LangChain 團隊推出的...

2025-10-10 ‧ 由 seedfood 分享
DAY 27

Day 27: LLM 監控實作:將Grafana與Prometheus連接起來

前言 上次我們下載安裝了Grafana和Prometheus要來監控Ollama LLM 的運行狀況,今天我們使用Docker compose的方式來把整個服務...

2025-10-11 ‧ 由 seedfood 分享
DAY 28

Day 28: LLM 監控實作:新增一個監控的功能,以streamlit為例

前言 前幾天的文章已經說明了Grafana和Prometheus的基本運用,今天我們試著新增一個 Streamlit 介面來調用 Ollama,並將相關 met...

2025-10-12 ‧ 由 seedfood 分享
DAY 29

Day 29: 最後的完成準備

前言 到昨天我們的RAG、Agent、以及監控都做完了基本介紹,接下來要介紹一下最終的專案全貌。 架構 筆者使用簡單的範例,在Qdrant裡面起了兩個colle...

2025-10-13 ‧ 由 seedfood 分享
DAY 30

Day 30: 寫完了卻沒寫完!

前言 昨天的最後一段測試,今天我們試著把所有功能串接起來,並使用Streamlit作呈現! 🔍 檢查我們的Qdrant Agentic RAG系統,最重要的知識...

2025-10-14 ‧ 由 seedfood 分享