iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
生成式 AI

30天RAG一點通 系列

這個「30天企業級RAG實戰計畫」是一個從理論到生產的完整課程。

第一階段建立RAG概念驗證原型,掌握文檔切分與嵌入模型選型。第二階段專注檢索優化與效能提升,實戰Rerank、混合檢索及ANN演算法,以應對企業級數據量。第三階段進入企業架構與安全治理,學習多租戶設計、增量索引、權限控制,並處理長文件與複雜查詢。第四階段聚焦生產部署與技術前沿,涵蓋微服務化、運維監控、A/B測試,並探索GraphRAG、多模態RAG與Agent等未來趨勢。

完成後,讀者將具備企業級RAG架構師能力,能獨立設計、實施並運維高精度、高可用的智能知識系統。

參賽天數 11 天 | 共 11 篇文章 | 2 人訂閱 訂閱系列文 RSS系列文
DAY 1

(RAG 1-1) RAG革命:重新定義企業知識管理

生成式 AI 與 RAG 的脈絡 生成式人工智慧(Generative AI,簡稱「生成式 AI」)正在快速進入各種企業與軟體應用場景。常見應用包含:• AI...

2025-08-25 ‧ 由 dallen12151830 分享
DAY 2

(RAG 1-2) LLM幻覺的工程解法:RAG如何重建信任

核心概念:大語言模型可靠性挑戰與RAG解決方案 大語言模型(LLM)的幻覺(Hallucination),是指它會自信地編造錯誤或不真實的資訊,這對需要高準確性...

2025-08-26 ‧ 由 dallen12151830 分享
DAY 3

(RAG 1-3) RAG 系統解剖:從文檔到智能問答的技術旅程

在前兩天,我們理解了企業為什麼需要 RAG,以及它如何解決大型語言模型 (LLM) 的幻覺問題。今天,我們將深入探索 RAG 的核心架構,了解它是如何運作的。...

2025-08-27 ‧ 由 dallen12151830 分享
DAY 4

(RAG 1-4) 文檔切分的科學:語義完整性與檢索效率的平衡術

RAG 系統中的文檔切分 (Chunking) 完整指南 在 RAG 系統裡,文檔切分 (Chunking) 是一個看似小細節,卻極大影響檢索與答案準確性的環節...

2025-08-28 ‧ 由 dallen12151830 分享
DAY 5

(RAG 1-5) 嵌入模型決策指南——準確度、成本與部署的三維權衡

核心概念: 嵌入模型(Embedding Model)決定了「檢索是否找得到正確東西」。在企業級 RAG 中,嵌入模型的選擇會同時影響 檢索精度、延遲與成本,並...

2025-08-29 ‧ 由 dallen12151830 分享
DAY 6

(RAG 1-6) 動手實戰——30 分鐘搭建第一個企業 RAG 系統

核心概念 RAG 系統核心組件開發與整合,從資料讀取、切分、嵌入、向量存儲到問答邏輯,建立完整的 RAG 處理管線。 學習內容 基礎環境搭建(Python +...

2025-08-30 ‧ 由 dallen12151830 分享
DAY 7

(RAG 1-7) 企業數據源大一統:從 PDF 到 API 的全方位整合

案例故事:一家跨國製造企業的挑戰 想像一家跨國製造企業,員工每天需要處理四類數據: PDF 文件:上千頁的產品手冊與維修指南 SQL 資料庫:零件庫存與供...

2025-08-31 ‧ 由 dallen12151830 分享
DAY 8

(RAG 2-1) 企業級百萬資料庫快速檢索方式---ANN

學習目標 理解 近似最近鄰檢索(ANN, Approximate Nearest Neighbor) 的核心概念 掌握兩種主流演算法:HNSW(Hierarc...

2025-09-01 ‧ 由 dallen12151830 分享
DAY 9

(RAG 2-2) 檢索精度突破:Rerank重排序的企業實踐

在 RAG 的檢索階段,我們會取得數個與使用者問題相關的 chunk,並按照相似度排序。但問題是: ANN 雖然快,但可能不準確(尤其在百萬級知識庫中,結果...

2025-09-02 ‧ 由 dallen12151830 分享
DAY 10

(RAG 2-3) 混合檢索與查詢智能化:召回率與精度的雙重保障

在企業級 RAG 系統中,光靠 向量檢索(Semantic Search)或 傳統關鍵字檢索(Lexical Search)往往不足: 向量檢索:語意理解強...

2025-09-03 ‧ 由 dallen12151830 分享