30天打造一個「能找、能想、可監控」的地端智慧檢索系統:從最小 RAG Baseline 出發,逐步加入 chunk 策略、Embedding Pipeline、向量庫比較、Hybrid + Rerank、Agent 工具化(ReAct, MRKL)與多步推理,再建立評估框架與監控儀表( Langfuse),最後整合為可部署 Demo。
前言 我們在介紹在 MRKL時有提到,調用工具(Tool) 是讓模型具備「行動能力」的核心組件。 在MRKL的框架下(其實AI Agent都是如此),LLM 並...
前言 在前面的章節中,我們了解了 Tool 是 LangChain Agent 調用外部能力的核心。 接下來,我們以Qdrant 向量搜尋 為例,示範如何把RA...
前言 實務應用中,RAG(Retrieval-Augmented Generation)系統不只是「模型表現」的問題,而是一整條查詢流程的效能與穩定性問題;再加...
前言 上一篇文章中我們討論了 RAG 至 Agentic RAG 系統中,延遲與準確度監控的重要性。 本篇我們將實際介紹兩個最常見的開源監控組合 —— Prom...
前言 今天先簡單說明如何建立基礎的 LLM 監控環境,我們先安裝以下: 🔥 Prometheus — 收集並儲存指標 (metrics) 🚨 Grafana...
前言 我們昨天已經安裝了Grafana和Prometheus,今天我們來讓LangSmith跑起來吧! LangSmith 是由 LangChain 團隊推出的...
前言 上次我們下載安裝了Grafana和Prometheus要來監控Ollama LLM 的運行狀況,今天我們使用Docker compose的方式來把整個服務...
前言 前幾天的文章已經說明了Grafana和Prometheus的基本運用,今天我們試著新增一個 Streamlit 介面來調用 Ollama,並將相關 met...
前言 到昨天我們的RAG、Agent、以及監控都做完了基本介紹,接下來要介紹一下最終的專案全貌。 架構 筆者使用簡單的範例,在Qdrant裡面起了兩個colle...
前言 昨天的最後一段測試,今天我們試著把所有功能串接起來,並使用Streamlit作呈現! 🔍 檢查我們的Qdrant Agentic RAG系統,最重要的知識...