[從零打造客製化 AI 聊天機器人] 什麼是 RAG ? - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2024 iThome 鐵人賽

DAY 3

0

自我挑戰組

從零打造客製化 AI 聊天機器人系列第 3 篇

[從零打造客製化 AI 聊天機器人] 什麼是 RAG ?

16th鐵人賽

2024-09-16 20:09:18

142 瀏覽

分享至

RAG （Retrieval-Augmented Generation 檢索增強生成）是一種自然語言處理模型，結合檢索（Retrieval）和生成（Generation ）技術。通過外部知識的檢索和語言生成模型結合，提高回覆的準確性和關聯性。

RAG 運作流程：

數據收集：收集應用所需的相關數據資料，這些數據可以是網頁、文字等等。
數據切分：將收集到的數據進行切分或更小的片段，以便於管理和檢索，這樣可以更快速獲得相關訊息。
嵌入（Embedding）：將切分好的文本數據轉換為向量表示，這些向量會存在向量資料庫中（例如：ChromaDB），便於後續的相似性搜尋。
處理用戶查詢：當使用者提出問題後，會將問題轉換為嵌入或向量表示，跟資料庫的文本進行比對。比對方式為餘弦相似度（Cosine Similarity）或歐幾里得距離（Euclidean Distance）等度量方式來尋找最相關的答案。
生成回應：檢索到相關資料後會使用大語言模型（例如：GPT）將這些資料作為輔助訊息，生成具有上下文相關性的回答。

RAG 優點：

增強準確性：提供額外上下文或知識來源，RAG 可使用大語言模型（LLM）更精確地回答問題，減少錯誤。
提高可靠性：RAG 使用外部檢索的真實數據輔助回答，減少 LLM 生成無根據或錯誤回答（稱為幻覺）情況。

RAG 缺點：

資源密集：RAG 需要大量計算資源來處理檢索和生成，特別是處理大量數據或高頻查詢。
依賴檢索質量：RAG 的整體效果取決於檢索模型的性能，如果檢索的結果不佳，則生成的回答也可能不精確。

RAG 常見應用：
智能客服系統、知識問答系統、文本摘要。

[從零打造客製化 AI 聊天機器人] 什麼是大型語言模型 (LLM)？

[從零打造客製化 AI 聊天機器人] 了解 Azure OpenAI 服務，註冊取得 API KEY

系列文

從零打造客製化 AI 聊天機器人共 30 篇

目錄

RSS系列文訂閱系列文

4 人訂閱

完整目錄

直播研討會

{{ item.subject }}

{{ item.channelVendor }} {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22195 篇

完賽人數

600 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙