iT邦幫忙

2024 iThome 鐵人賽

DAY 3
0
自我挑戰組

從零打造客製化 AI 聊天機器人系列 第 3

[從零打造客製化 AI 聊天機器人] 什麼是 RAG ?

  • 分享至 

  • xImage
  •  

RAG (Retrieval-Augmented Generation 檢索增強生成)是一種自然語言處理模型,結合檢索(Retrieval)和生成(Generation )技術。通過外部知識的檢索和語言生成模型結合,提高回覆的準確性和關聯性。

RAG 運作流程:

  1. 數據收集:收集應用所需的相關數據資料,這些數據可以是網頁、文字等等。
  2. 數據切分:將收集到的數據進行切分或更小的片段,以便於管理和檢索,這樣可以更快速獲得相關訊息。
  3. 嵌入(Embedding):將切分好的文本數據轉換為向量表示,這些向量會存在向量資料庫中(例如:ChromaDB),便於後續的相似性搜尋。
  4. 處理用戶查詢:當使用者提出問題後,會將問題轉換為嵌入或向量表示,跟資料庫的文本進行比對。比對方式為餘弦相似度(Cosine Similarity)或歐幾里得距離(Euclidean Distance)等度量方式來尋找最相關的答案。
  5. 生成回應:檢索到相關資料後會使用大語言模型(例如:GPT)將這些資料作為輔助訊息,生成具有上下文相關性的回答。

RAG 優點:

  • 增強準確性:提供額外上下文或知識來源,RAG 可使用大語言模型(LLM)更精確地回答問題,減少錯誤。
  • 提高可靠性:RAG 使用外部檢索的真實數據輔助回答,減少 LLM 生成無根據或錯誤回答(稱為幻覺)情況。

RAG 缺點:

  • 資源密集:RAG 需要大量計算資源來處理檢索和生成,特別是處理大量數據或高頻查詢。
  • 依賴檢索質量:RAG 的整體效果取決於檢索模型的性能,如果檢索的結果不佳,則生成的回答也可能不精確。

RAG 常見應用:
智能客服系統、知識問答系統、文本摘要。


上一篇
[從零打造客製化 AI 聊天機器人] 什麼是大型語言模型 (LLM)?
下一篇
[從零打造客製化 AI 聊天機器人] 了解 Azure OpenAI 服務,註冊取得 API KEY
系列文
從零打造客製化 AI 聊天機器人30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言