前面的文章我們介紹了各項RAG的架構,以及可以用來優化RAG的方法,但實務上基本的RAG,其實是會遇到許多瓶頸的! 例如檢索僅有單輪、複雜問題需要推理、或是背後資料量過大過複雜,有許多不同情境。
而隨著LLM越來越聰明,AI Agents技術越來越成熟,Agentic RAG這個架構就出現來協助突破傳統RAG的瓶頸了! 透過引入 AI Agents,使整個流程從靜態線性管道進化為 動態、具推理能力的自主系統,能分解複雜問題、執行多步驟檢索,並靈活使用工具,成為真正能解決問題的智能助手! 接下來我們就進一步了解一下到底什麼是Agentic RAG吧!
圖片來源:weaviate
Agentic RAG 將AI Agent 嵌入到 RAG 管線中,使其能夠超越傳統RAG的靜態限制,並且能執行複雜的任務和多步驟推理,基本定義筆者整理如下幾點:
1. 由AI Agent驅動的 RAG 實作
2. 目的與優勢
系統透過在 RAG 管線中添加 AI Agent來提高適應性與準確性,因此能克服傳統 RAG 固有的限制(後面我們會再仔細列出幾點)
3. 功能轉變
Agentic RAG 將 RAG 從一個固定的管線轉變為一個互動式、推理驅動的過程。
Agentic RAG 的關鍵在於 Agents 的能力,它們不只是檢索與生成,而是能自主規劃、判斷與行動。
參考前面Weaviate上的Agentic RAG架構圖,大致上我們可以把組成分成:
不同任務場景需要不同的架構,以下是常見設計:
單代理架構(Router Model)
多代理架構(Multi-Agent Architecture)
層級架構(Hierarchical Architecture)
自我修正架構(Corrective & Adaptive RAG)
圖結構架構(Graph-Based Architecture)
我們快速整理一下傳統RAG與Agentic RAG的比較如下表:
面向 | 傳統 RAG | Agentic RAG |
---|---|---|
工作流程 | 線性、一次性(Retrieve → Read/Generate) | 動態、迭代、多步(Agent 規劃→檢索→工具呼叫→反思→再檢索) |
檢索次數 | 通常 1 次(Advanced 會含 rerank) | 多次迭代檢索(Iterative Retrieval) |
推理能力 | 限於輸入上下文與 LLM 本身(有限的 multi-hop) | 代理人可拆解任務並進行多步推理與合成 |
工具/外部來源整合 | 常為單一向量庫或預先定義之工具 | 動態調用多工具、多來源(API、DB、Web、KG) |
錯誤處理 / 自我修正 | 多為被動;少或無自我驗證機制 | 具反思(Reflection)與自我批判/重試機制(Corrective loops) |
可擴展性 | 模組化版本可擴展,但流程仍靜態 | 高度可組合與可擴展;可用多代理協作分散負載 |
延遲與成本 | 相對較低(單步) | 可能較高(多步、更多工具呼叫、更多 LLM 請求) |
適用場景 | 單一句事實查詢、或小型知識庫問答 | 多跳查詢、跨資料源研究、流程自動化、複雜決策支援 |
單一步驟檢索(Single Retrieval Step)
傳統 RAG 常只做一次檢索並將結果直接送入 LLM,若首輪檢索不佳,後續輸出受限。
有限的多步推理能力(Limited Multi-Step Reasoning)
即便有 re-rank,仍然是單輪檢索→排序→生成,無法像人一樣拆解多階段問題並逐步補查證據。
單一知識來源(Single Knowledge Source)
多為靜態向量庫,缺乏即時資料或多來源整合能力(例如 API、網路搜尋、結構化 DB)。
缺乏驗證與修正機制(No Self-Validation)
傳統流程通常不會自動檢查檢索結果的相關性或對生成結果進行事實性驗證。
查詢—文件不匹配(Query-Document Mismatch)
使用者問題與文檔語氣/格式不同,會導致難以直接匹配到最佳片段。
迭代檢索(Iterative Retrieval)與查詢精煉(Query Refinement)
代理人會根據中間結果重寫或細化查詢,重複檢索直至找到更高質量的上下文。
任務規劃(Planning)與多步推理
代理人能拆解複雜任務成子任務(例如:檢索 → 驗證 → 計算 → 彙整),並按步驟執行。
動態工具呼叫(Dynamic Tool Use)
可根據任務需求即時呼叫不同工具(向量庫、網頁搜尋、計算工具、SQL、知識圖譜等)。
反思與自我修正(Reflection / Corrective Loops)
代理人能用評估模組(grader / relevance evaluator)檢查中間結果並決定是否重試或改變策略。
多代理協作(Multi-Agent)與編排(Orchestration)
藉由 Coordinator 與 Worker 模式分派專責任務,可並行處理並彙整結果,提高吞吐與可靠性。
選傳統 RAG(Naïve / Advanced / Modular):
選 Agentic RAG :
明天我們將介紹Agent flow的相關選擇和概念!
Agentic RAG(lagegraph)
Agentic RAG(huggingface)
What is Agentic RAG(weaviate)
What is agentic RAG?(IBM)
Agentic RAG With LangGraph and Qdrant