iT邦幫忙

2025 iThome 鐵人賽

0
佛心分享-IT 人自學之術

LLM入門學習系列 第 30

Day 30 總結報告

  • 分享至 

  • xImage
  •  

Day 30 總結報告:RAG 智能客服專案回顧與技術掌握

一、專案背景與整體目標

本專案圍繞「校園 FAQ 智慧客服」主題展開,目標是建立一個具備語義理解精準檢索智能生成能力的 Chatbot。

整體系統採用 RAG (Retrieval-Augmented Generation) 架構,成功整合了傳統向量檢索的高效性與大型語言模型 (LLM) 的生成能力,實現了從 「以問找答」到「以問生成答案」 的技術飛躍。

二、開發歷程回顧與技術里程碑

本專案從 Day 24 到 Day 29,實現了從數據準備到應用部署的完整流程。

開發階段 Day 主題 核心成果與技術掌握
數據準備 24 知識庫建立 掌握 sentence-transformers 嵌入技術,建立 FAISS 向量索引
核心邏輯 25 檢索驗證 實現 FAISS/sklearn 語義檢索,確保問題與答案的精準匹配。
介面部署 26 Chatbot 互動介面 運用 Gradio 快速建構 Web 應用,實現人機互動。
系統強化 27 系統優化 實作 未知問題處理(閾值判斷)、LRU 快取,強化系統的魯棒性與效能。
功能擴充 28/29 最終整合版 成功整合 LLM 生成(GPT-3.5)對話記憶引用來源顯示ROUGE/BLEU 自動評估

三、RAG 系統架構總覽

技術棧整理

模組 主要功能 關鍵套件/模型
文字嵌入 (Embedding) 將問答內容轉為向量表示 sentence-transformers, OpenAIEmbeddings
向量檢索 (Retrieval) 快速搜尋最相似知識 faiss-cpu (FAISS)
生成模型 (Generation) 根據 Context 生成自然語言回答 ChatOpenAI (GPT-3.5)
互動介面 (UI) 視覺化聊天功能與部署 Gradio
品質評估 衡量回答的準確度與相似度 rouge, nltk (BLEU)

四、專案核心功能與技術亮點

本 Chatbot 專案的成功之處在於以下功能亮點:

  1. 幻覺控制與安全規則:通過設定系統 Prompt 和相似度閾值,強制 LLM 僅根據知識庫回答,並在無相關資料時禮貌拒絕,有效控制了系統風險。
  2. 對話記憶與連貫性:成功實現對話歷史的傳遞,使 LLM 具備上下文理解能力,支援多輪、連貫的問答體驗。
  3. 系統透明度:自動顯示答案的引用來源(文件 metadata),極大增強了 Chatbot 回答的可信度
  4. 自動化品質評估:引入 ROUGE-LBLEU 指標,提供了客觀的數據基礎來驗證和迭代系統的回答品質。

五、整體成效與未來展望

成效總結

  • 準確率:系統表現出極高的穩定性,能從複雜的 FAQ 知識庫中準確回傳或生成高度相關的答案。
  • 效能:透過 FAISS 索引LRU 快取,確保了系統的低延遲響應。
  • 可擴充性:系統架構具有高度解耦性,只需更換 CSV 數據,即可快速擴展到其他語言或領域的客服應用。

上一篇
Day 29:功能擴充與自動評估 — 完整實作版
系列文
LLM入門學習30
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言