Day 2｜RAG 的基本架構

2025 iThome 鐵人賽

DAY 2

AI & Data

17th鐵人賽 rag llm

348 瀏覽

昨天我們提到 LLM 有三個限制：資料過時、資料來源有限，以及容易產生幻覺。今天要介紹的 RAG（Retrieval-Augmented Generation），就是為了補上這些缺口而設計的。

要理解 RAG，我們先來看一下它的架構圖：

圖片來源：Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

這張圖可能一開始看起來有點複雜，不過不用擔心，接下來我們會一步一步拆解，慢慢解釋 RAG 想要傳達的概念。

Retriever（檢索器）
使用者在提出問題後，我們的檢索器就會去資料庫或知識庫裡「找資料」。這裡通常會用向量資料庫（Vector DB），把問題轉換成向量，再去找最相關的段落或文件。這樣就能解決「資料過時」的問題，因為我們可以放最新的資料進去。
Reader（生成器／LLM）
在檢索器成功檢索到相關資料後，LLM 會將輸入的問題結合檢索的資訊再來生成答案，也正是因為有檢索的依據，所以比較不會亂編，能降低幻覺的機率。
結合結果（Answer / Response）
最後輸出的答案，是「LLM 的語言能力」＋「檢索到的外部知識」的組合。這樣一來，LLM 就不再只靠記憶，而是能即時使用外部資訊。