為什麼需要談?
文件每天在變;重訓模型貴又慢。RAG 把「知識更新」變成「文件治理」問題,成本更可控。
白話定義
RAG=檢索(先找到對的段落)+生成(用段落回答,並標來源)。不是讓模型硬記,而是「邊查邊答」。
常見情境
內規/流程/FAQ(需要最新版本、可溯源)
產品/技術文件(跨文件比對、摘錄)
合規與審計(每句關鍵說法都要有出處)
常見誤解
有 RAG 就不會胡扯(檢索不到或來源矛盾照樣亂講)
只有向量搜就夠(專有名詞、代碼需要關鍵字/規則搭配)
實用心法
三角決策:
RAG:知識常變、需引用、資料可治理 → 先選它
微調:表達風格/任務格式高度一致且穩定
工具連結:答案依賴外部事實(資料庫、查詢器)
資料先行:投入在文件清整、語義切塊、近新版本加權。
引用強制:沒有來源就不給結論(或降級為「可能」說法)。
檢核清單
文件是否有版本控管與過期標示?
切塊是否以語義單位而非固定長度?
回答是否一律附來源與段落定位?
小結
RAG 不是萬靈丹,但它把「更新知識」的難題搬到你能掌控的地方:文件與流程。