Day20 RAG架構筆記_組成三大元素

2024 iThome 鐵人賽

DAY 0

生成式 AI

除了ChatGPT，你了解生成式AI的其他應用嗎？30天從零到精通的學習與實作系列第 20 篇

16th鐵人賽

eunice_hsu

2024-10-13 22:13:53

2700 瀏覽

分享至

所以RAG是什麼？

RAG（Retrieval-Augmented Generation）是一種結合檢索和生成技術的框架，用來提升自然語言處理任務的效果。它的主要目的是讓語言模型在回應時，能夠結合外部知識庫中的相關資訊，而不只是依賴模型的內部訓練數據。這樣可以讓模型生成的回答更精準且有根據。

RAG由三個主要元素組成：Loader、Retriever、以及LLM（Large Language Model）Generator。

1. Loader - 存取數據
Loader 的角色是從外部資料來源（如資料庫或文件庫）中讀取數據。這些數據可以是結構化的（例如 CSV 表格）或非結構化的（例如網頁或 PDF 檔案）。Loader 負責將這些資料載入並進行初步處理，使其可以被後續的檢索和生成步驟使用。

2. Retriever - 進行語意檢索、排序
Retriever 是 RAG 框架中的檢索工具，能夠根據使用者的查詢從資料庫中篩選出最相關的資料。它的功能類似於搜尋引擎，但更強調語意上的相似度，而不僅僅是關鍵字匹配。Retriever 的目標是找到能夠補充語言模型知識的資料，並將這些資料排序，選出最有幫助的幾條信息提供給生成模型。

3. LLM Generator - 組成 Response
LLM Generator 是負責生成最終回應的語言模型。它會將 Retriever 提供的外部資料作為輔助，結合內部知識產生一個更具資訊性和準確性的回答。這個過程中，生成模型可以利用 Retriever 檢索到的資料來填補原本訓練數據中不足的地方，避免回應過於籠統或不完整。

RAG 的優點在於它能動態擴展語言模型的知識範圍，使回應更加符合現實情境，特別適合用於需要查找外部資料的應用，如醫療資訊查詢或客服系統。這種結合檢索與生成的方法，讓 RAG 成為現代語言模型架構中的重要工具。