iT邦幫忙

2025 iThome 鐵人賽

DAY 2
0

昨天我們提到 LLM 有三個限制:資料過時、資料來源有限,以及容易產生幻覺。今天要介紹的 RAG(Retrieval-Augmented Generation),就是為了補上這些缺口而設計的。

要理解 RAG,我們先來看一下它的 架構圖:
https://ithelp.ithome.com.tw/upload/images/20250916/20178897qGDI9oM440.png
圖片來源:Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

這張圖可能一開始看起來有點複雜,不過不用擔心,接下來我們會一步一步拆解,慢慢解釋 RAG 想要傳達的概念。

RAG 架構拆解

  1. Retriever(檢索器)
    使用者在提出問題後,我們的檢索器就會去資料庫或知識庫裡「找資料」。這裡通常會用向量資料庫(Vector DB),把問題轉換成向量,再去找最相關的段落或文件。這樣就能解決「資料過時」的問題,因為我們可以放最新的資料進去。
  2. Reader(生成器/LLM)
    在檢索器成功檢索到相關資料後,LLM 會將輸入的問題結合檢索的資訊再來生成答案,也正是因為有檢索的依據,所以比較不會亂編,能降低 幻覺 的機率。
  3. 結合結果(Answer / Response)
    最後輸出的答案,是「LLM 的語言能力」+「檢索到的外部知識」的組合。這樣一來,LLM 就不再只靠記憶,而是能即時使用外部資訊。

這邊說明一下為什麼會用向量資料庫,因為電腦不像人類一樣能直接理解文字的意思,但它能處理數字,所以我們會把文字轉成向量。這裡先簡單點到,之後我會再介紹更詳細完整的內容~

簡單讓大家知道 RAG 的整體架構後,明天我們就要進一步學習如何建立知識庫。這個過程的第一步,就是 Chunking(文件切分)——把長長的文件切成 AI 可以理解的小片段。


上一篇
Day 1|什麼是 RAG?
下一篇
Day 3|Indexing pipeline:如何為 RAG 建立知識庫
系列文
RAG × Agent:從知識檢索到智慧應用的30天挑戰5
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言