不再瞎編故事的小助手 - RAG 檢索增強生成的煉金術 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2025 iThome 鐵人賽

DAY 7

AI & Data

不只是反覆 TRY AGAIN，煉金師懂得調配試煉的秘方。系列第 7 篇

不再瞎編故事的小助手 - RAG 檢索增強生成的煉金術

17th鐵人賽

tony123344333

團隊組隊最大障礙：隊名

2025-09-21 22:02:00

171 瀏覽

分享至

你有沒有遇過這種令人抓狂的情況？

你興奮地問 AI：「請幫我分析一下我們公司去年的營收狀況」，結果 AI 信心滿滿地回答：「根據資料顯示，貴公司去年營收成長了 23.7%，主要來自於亞太地區的擴張...」聽起來很專業對吧？

問題是，你們公司去年根本是虧損的，而且從來沒有進軍過亞太地區。

歡迎來到 AI 幻覺 (Hallucination) 的奇幻世界，在這裡，AI 會用最自信的語氣說出最離譜的謊言。

幻覺的根源：AI 的「創作天賦」

為什麼 AI 總愛瞎編故事？這要從語言模型的本質說起。

AI 語言模型就像一位超級健談的朋友，它的工作原理是「預測下一個最可能出現的詞」。當你問它一個問題時，它會基於訓練資料中的統計模式，生成「聽起來最合理」的回應。

注意這個關鍵詞：「聽起來」合理，而不是「事實上」正確。

就像一位口才極佳但記性不好的銷售員，AI 總是能說出流暢動聽的話，但內容的真實性...就看運氣了。

Context Engineering 的終極考驗

還記得昨天我們談到的 Context Engineering 嗎？我們學會了資訊篩選、結構設計、注意力引導等技巧。但面對幻覺問題，這些技巧遇到了一個根本性的挑戰：

如果 AI 的記憶庫裡根本沒有正確答案怎麼辦？

你可以用最精美的提示工程技巧，設計最完美的思維架構，但如果 AI 腦中沒有你需要的特定資訊，它依然會開始「自由創作」。

這就像要求一位從沒去過台灣的導遊為你規劃台北三日遊，無論他的解說技巧多麼精湛，路線規劃多麼詳細，結果都可能是一場災難。

RAG 登場：為 AI 裝上「外接硬碟」

RAG (Retrieval-Augmented Generation) 檢索增強生成，就是為了解決這個根本問題而誕生的煉金術。

想像一下，你為那位健談但記性不好的 AI 朋友配了一位勤奮的助理。每當你問問題時：

助理先去查資料 (Retrieval)：在你的資料庫、文件庫、知識庫中搜尋相關資訊
把資料整理好給 AI (Augmentation)：將找到的相關資訊結構化地提供給 AI
AI 基於真實資料回答 (Generation)：AI 不再瞎編，而是基於你提供的真實資料來生成回應

這就像給 AI 裝上了「外接硬碟」，讓它能夠存取到最新、最準確、最相關的資訊。

RAG 煉金工房的進化：從基礎到前沿

第一代：基本 RAG 架構

最初的 RAG 系統就像是一個簡單的圖書館查詢系統：

用關鍵字搜尋相關文件
把找到的文件直接丟給 AI
期待 AI 能給出正確答案

結果？AI 依然會被混淆、產生幻覺，只是頻率稍微降低了一些。

第二代：兩階段檢索系統 - 寧可錯殺，不可放過

現代的煉金師意識到一個問題：檢索的準確性比 AI 的智慧更重要。於是發展出了兩階段檢索策略：

第一階段：大量篩選 (Broad Recall)

目標：寧可錯殺，不可放過
從知識庫中撈出 100-1000 個可能相關的文件
使用語義向量搜尋 (如 Microsoft E5 模型)
追求完整性，寧可多找也不要漏掉

這裡有個關鍵認知：AI 跟我們人類完全不同，它可以在幾秒鐘內「閱讀」上千份文件。人類面對 1000 個文件會崩潰，但對 AI 來說這只是一次正常的批次處理。所以第一階段可以大膽地「廣撒網」，不用擔心資訊過載的問題。

想像一下，如果你要在圖書館找資料，可能一天只能翻閱 10-20 本書。但 AI 可以在 1 秒內「瀏覽」1000 本書的目錄和摘要，這種超人類的資訊處理能力正是兩階段檢索的基礎。

第二階段：AI 精準排序 (Reranking)

目標：從大量候選中找出最相關的 3-5 份文件
使用三種主要技術：

Cross-Encoder：把問題和每份文件組成一對，用模型深度分析相關性。準確度最高，但速度最慢。
ColBERT：先分別理解問題和文件，再用數學運算找匹配。平衡了速度與準確性。
LLM 排序：直接請 LLM 評估並排序文件。最智慧但成本較高，不過隨著模型效率提升，成本正在逐漸降低。

這種「先撒大網，再精挑細選」的策略，讓檢索準確度有顯著提升，幻覺率也跟著大幅下降。

第三代：CRAG 糾錯系統 - AI 學會自我反省

CRAG (Corrective RAG) 讓 AI 學會了「自我反省」。

CRAG 的核心概念：不要盲目相信檢索結果，要先評估品質再決定行動。

CRAG 的三重判斷機制：

正確 (Correct)：當檢索結果品質良好時
- 對文件進行知識精煉處理
- 提取最相關的資訊片段
- 過濾掉無關內容
錯誤 (Incorrect)：當檢索結果品質不佳時
- 啟動替代搜尋策略
- 可能包含網路搜尋或重新檢索
- 尋找更可靠的資訊來源
模糊 (Ambiguous)：當檢索結果不夠明確時
- 結合多種策略
- 交叉比對不同來源
- 提供更全面的資訊整合

實際效果：根據相關研究報告，CRAG 等先進 RAG 技術確實能顯著降低 AI 幻覺問題。雖然具體的改善幅度會因應用場景而異，但多項研究都顯示這類技術在提升 AI 回應準確性方面有明顯成效。

煉金師的防幻覺技巧包

除了改進檢索架構，現代煉金師還有其他幾招防幻覺的絕技：

技巧一：多重驗證 (Multi-Agent Verification)

讓多個 AI 分別檢查同一個答案：

檢索 Agent：負責找資料
驗證 Agent：負責檢查答案是否符合資料
品質 Agent：負責評估整體回應品質

就像法庭上的三重驗證：證人、律師、法官各司其職。

技巧二：自我反思機制 (Self-Reflection)

讓 AI 在回答後自問：「我的答案有足夠的證據支撐嗎？」

AI 內心獨白：
「剛才我說這家公司營收成長 23.7%，但我檢查一下資料...
咦，資料顯示的是虧損 5.2%？
我應該修正我的回答。」

技巧三：不確定性表達 (Uncertainty Quantification)

教 AI 學會說「我不知道」：

當證據不足時：「根據現有資料，我無法確定...」
當資料衝突時：「資料來源顯示不同的結果...」
當超出範圍時：「這個問題超出了我的知識範圍...」

技巧四：來源追蹤 (Source Attribution)

每個答案都要標明出處：

「根據《2024年度財報》第 15 頁...」
「根據內部會議記錄顯示...」
「根據客戶滿意度調查 (樣本數 1,000)...」

技巧五：即時文檔注入 (Real-time Documentation)

以程式設計為例，像 Context7 這樣的 MCP (Model Context Protocol) 工具，提供了另一種防幻覺思路：

預防勝於治療：與其等 AI 產生錯誤程式碼再修正，不如在一開始就給它最新、正確的文檔。

提示範例：
「用 FastAPI 建立一個 JWT 認證的 API，use context7」

Context7 自動做的事：
1. 辨識關鍵字：FastAPI
2. 抓取最新官方文檔
3. 注入到 AI 的 context 中
4. AI 基於最新文檔生成程式碼

這種方式特別適合快速變化的技術領域，確保 AI 不會使用已被棄用的 API 或方法。

實戰案例：客服機器人的華麗轉身

讓我們看看一個真實的改造案例：

改造前：幻覺連篇的客服

客戶：「你們的退貨政策是什麼？」
舊系統：「我們提供 30 天無條件退貨，只要商品包裝完整即可。」

實際情況：公司退貨期限只有 7 天，且有嚴格條件
結果：客戶投訴、客服部門疲於奔命

改造後：有據可查的專業客服

第一階段檢索：搜尋「退貨政策」，找到 100 個相關文件片段
第二階段排序：AI 從中選出最相關的 3 份文件
CRAG 評估：文件品質良好，進行知識精煉

客戶：「你們的退貨政策是什麼？」
新系統：「根據我們的客戶服務條款第 3.2 節，商品可在收到後 7 個工作天內退貨。
退貨商品需符合以下條件：
1. 商品未使用且包裝完整
2. 附上原始購買收據  
3. 非客製化商品

詳細退貨流程請參考官網退貨頁面，或者我可以直接為您安排退貨服務。
【資料來源：客戶服務條款 v2.3, 更新日期：2024/08/15】」

結果：

客戶滿意度提升 35%
客服糾紛降低 60%
客服工作效率提升 40%

從幻覺製造機到知識顧問的進化

RAG + 防幻覺技術讓 AI 從一個「愛說故事的朋友」變成了「專業的知識顧問」。

這個轉變的意義遠不只是技術層面的改進，而是讓我們重新定義了 AI 的角色：

過去：AI 是一個創意夥伴，擅長腦力激盪和創意發想
現在：AI 是一個知識助理，能夠精準地檢索和整合資訊
未來：AI 將成為智慧決策夥伴，結合創意與知識，提供全方位支援

煉金師的下一步修練

掌握了 RAG 技術和防幻覺技巧，你已經從「靠運氣的賭徒」進化成了「有方法的煉金師」。但這只是開始。

現代 AI 的世界正在快速發展，從單純的問答系統，到能夠主動行動的智慧助手。從靜態的知識查詢，到動態的工具整合。

記住：在 AI 的世界裡，最危險的不是 AI 不夠聰明，而是它太過自信地說出錯誤的答案。掌握防幻覺技術，就是讓 AI 在「我知道」和「我不知道」之間找到平衡，這才是真正的智慧。

作為一位合格的 AI 煉金師，你不只要會使用工具，更要理解工具的限制。不只要追求更好的輸出，更要確保輸出的可靠性。

這就是現代煉金術的精髓：既要有魔法的效果，也要有科學的方法。

從記憶管理到資訊建築師 - Context Engineering 登場

煉金師的全域視野 - Context Engineering 的完整藍圖

系列文

不只是反覆 TRY AGAIN，煉金師懂得調配試煉的秘方。共 30 篇

RSS系列文訂閱系列文

3 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19855 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

不只是反覆 TRY AGAIN，煉金師懂得調配試煉的秘方。系列 第 7 篇