iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
AI & Data

RAG × Agent:從知識檢索到智慧應用的30天挑戰 系列

這次挑戰中,我以RAG × Agent:從知識檢索到智慧應用的30天挑戰」為主題,試想紀錄自己從零開始學習檢索式生成 (Retrieval-Augmented Generation, RAG) 的過程。
內容會包含幾個部分,先從探索RAG的基礎原理開始,最後希望可以進一步延伸到 AI Agent 的應用。

參賽天數 23 天 | 共 23 篇文章 | 0 人訂閱 訂閱系列文 RSS系列文
DAY 11

Day 11|實戰 Chunking:從《資通安全管理法》學習切分技巧

今天就開始我們的實作,這次我取用的資料是資通安全管理法,這邊可以直接點擊網站下載。 1. 取得文件內的文字要處理這個文件前,要先取得這個檔案的內容。 # 要先安...

2025-09-25 ‧ 由 otterday 分享
DAY 12

Day 12|實戰向量資料庫:用 ChromaDB 查詢法規內容

昨天已經教學大家要怎麼做 Chunking 了,今天就是要教學如何把它放進一個可以用來查詢的資料庫,這邊我們也會試著提問,看產出。雖然我昨天的教學只有教你怎麼切...

2025-09-26 ‧ 由 otterday 分享
DAY 13

Day 13|實戰 Generation Pipeline:Chroma 檢索 × Ollama 生成的完整流程

今天要實作的內容是 Generation pipeline 的部分,就是怎麼將提問跟 RAG 檢索到的資料全部丟到 LLM 給他做回應。 因為這邊後面的實作內容...

2025-09-27 ‧ 由 otterday 分享
DAY 14

Day 14|RAG 評估方法概要:量化效能,避免幻覺

這次要講的內容是 如何去評估 RAG 的效能。我們使用 RAG 的最大原因,就是希望能避免 LLM 產生幻覺,但問題是:即使結合了檢索,我們仍然不能百分之百保證...

2025-09-28 ‧ 由 otterday 分享
DAY 15

Day 15|RAG 評估指南(1/2):檢索指標(上)

昨天有說到 RAG 的效能衡量可以分成兩大類,今天就是要先介紹檢索指標(Retrieval metrics)。我們不需要把檢索和生成混在一起看,而是可以單獨檢查...

2025-09-29 ‧ 由 otterday 分享
DAY 16

Day 16|RAG 評估指南(1/2):檢索指標(中)

延續昨天的內容,如果想回顧其他指標的話可以看上一篇--Day 15|RAG 評估指南(1/2):檢索指標(上)廢話不多說了,我們馬上開始! 5. F1 分數...

2025-09-30 ‧ 由 otterday 分享
DAY 17

Day 17|RAG 評估指南(1/2):檢索指標(下)

今天只負責總結內容噢!如果需要看更詳細的內容就請回顧下面這兩天的: Day 15|RAG 評估指南(1/2):檢索指標(上) Day 16|RAG 評估...

2025-10-01 ‧ 由 otterday 分享
DAY 18

Day 18|RAG 評估指南(2/2):RAG 特定指標(上)

前面有介紹過一些傳統的指標像是精確率、召回率那些,不過那些指標都不能完整的反應 RAG 的效能,因為 RAG 的系統同時會牽涉到「檢索」與「生成」兩個部分,所以...

2025-10-02 ‧ 由 otterday 分享
DAY 19

Day 19|RAG 評估指南(2/2):RAG 特定指標(下)

昨天介紹了 RAGAs 當中的核心指標了,今天是主要討論跟總結。其實昨天只提到了最主要的核心部分,不過還有很多可以去仔細翻閱查看,這邊就留給大家學習了,絕對不是...

2025-10-03 ‧ 由 otterday 分享
DAY 20

Day 20|實戰 RAGAs:量化檢索與生成的表現

前面指標能介紹的都介紹完了,今天就開始我們的實作吧!要複習的話可以參考前幾天的內容,就讓我們開始ㄅ~ 1. 安裝環境這邊我們使用 Ollama + Mistr...

2025-10-04 ‧ 由 otterday 分享