新來的朋友,建議可以先回顧前幾天的文章,之前已經分別聊過 RAG 的兩大流程:
今天就來做一個「小總結 + 藍圖規劃」,結合先前所說的內容,並構思我們接下來要實作的第一個 RAG 系統。
不能只是講理論,還是要動作做做看才知道問題在哪裡,因為學生沒什麼摳摳,所以工具選擇上也會盡量用免費資源。
我的目標是想做出一個簡易的 「台灣資安法條查詢助理」,流程大概會長這樣:
蒐集資料
這邊會利用開放的台灣資安相關法條,像是《資通安全管理法》,先做資料預處理。
建立知識庫(Indexing pipeline)
用 Python 讀文件 → 切分段落(Chunking)。
用免費的 embedding 模型(如 BGE-M3)把文字轉成向量,之後再將向量存進 ChromaDB(免費 & 本地就能跑)。
3.設計檢索與回答(Generation pipeline)
使用者提問,例如:「資安管理法對資通服務的定義是什麼?」
問題 → 轉向量 → 在 ChromaDB 找相近段落。
之後再把找到的法條片段 + 原始問題一起送進 LLM(免費或本地模型),產生回答。
或善用 OpenAI 免費額度(如 GPT-4o-mini)
當然這只是我粗略的規劃,如果我後續實作內容有甚麼調整,我也會修正的><