阿，又是一個RAG :: 2025 iThome 鐵人賽

poyuanchih (poyuanchih)

iT邦新手 5 級 ‧ 點數 265

數學系

1149

累計瀏覽數

站內簡訊追蹤

鐵人檔案

2025 iThome 鐵人賽

回列表

生成式 AI

阿，又是一個RAG 系列

這是一個以 RAG為名的系列，但其實大部分篇幅應該都在處理資料，預計內容包含：
(1) 取得(context, question, answer)對的三種方法
(2) 以Label Studio建立ground-truth
(3) 搭建 RAG baseline
(4) 探索驗證框架
(5) 各式方法論的實測
我會實測檢索的recall 、答題的忠實度以及 LLM as a judge的表現
看看現代 LLM／RAG／Agent 在自製題目集的能力與限制

鐵人鍊成｜共 30 篇文章｜ 1 人訂閱訂閱系列文 RSS系列文

0 Like 1 留言 182 瀏覽

DAY 1

day0: index

day0: Index 這個系列以 RAG（Retrieval-Augmented Generation）為名，但真正的重點大部分都落在資料處理與驗證。整體開發...

2025-09-15 ‧ 由 poyuanchih 分享

0 Like 0 留言 288 瀏覽

DAY 2

Day1-get_context_from_YT

TL;DR 我們今天兜了三個小工具，程式在這裡的days/day1python get_transcription.py是從自帶字幕的youtube連結獲取字幕...

2025-09-16 ‧ 由 poyuanchih 分享

0 Like 0 留言 159 瀏覽

DAY 3

Day2-RagDatasetGenerator

Result 首先是今天的結果： { "query":"老師為何在課程中仍保留需要花三到四個小時訓練的作業？這類作業...

2025-09-17 ‧ 由 poyuanchih 分享

0 Like 0 留言 156 瀏覽

DAY 4

Day3 Observability: 把 LlamaIndex 的呼叫接到 Langfuse 上

Situation: 今天是一個額外的任務，主要是有時候想直接套一些 LlamaIndex 包好的範例，但是沒看 source code 的情況下實在不知道它裡...

2025-09-18 ‧ 由 poyuanchih 分享

0 Like 0 留言 203 瀏覽

DAY 5

Day4: Langfuse 上的 Tracing 是怎麼來的，以及怎麼從 Langfuse 拿資料

Situation: 我們昨天配置了 Langfuse 讓我們可以在 Langfuse 上看到 LlamaIndex 的 QueryEngine.query 之...

2025-09-19 ‧ 由 poyuanchih 分享

0 Like 0 留言 169 瀏覽

DAY 6

Day5: 從 Youtube 下載的字幕生成問題與答案對

Situation: 我們想要替RAG系統獲得成對的 (context, question, answer) 供後續方法論的驗證在day1-get_cont...

2025-09-20 ‧ 由 poyuanchih 分享

0 Like 0 留言 261 瀏覽

DAY 7

Day6: pdf2txt 使用 llama-parse 與 mistral-ocr

Situation: 我們想要替RAG系統獲得成對的 (context, question, answer) 供後續方法論的驗證在 day1 ~ day5...

2025-09-21 ‧ 由 poyuanchih 分享

0 Like 0 留言 244 瀏覽

DAY 8

Day7: perplexity api 初探與 fact_ckecher 功能測試

Situation: 我們想要獲得成對的 (context, question, answer) 並做成資料集，以供後續 RAG 方法論的驗證先前的文章(d...

2025-09-22 ‧ 由 poyuanchih 分享

0 Like 0 留言 161 瀏覽

DAY 9

Day8: Tavily 與 FunctionAgent

Situation: 給定一個問題(question)，我們正在尋求一個方法，可以幫我們找到對應的 context 以及 answer，來讓我們可以構造出 (...

2025-09-23 ‧ 由 poyuanchih 分享

0 Like 0 留言 156 瀏覽

DAY 10

Day9: longllmlingua2 與 Node PostProcessor

Situation: 我們昨天試了 Tavily research 想要看看可不可以直接查到好的 context ，但發現查回來的內容本身就帶有很多雜訊，應該...

2025-09-24 ‧ 由 poyuanchih 分享

poyuanchih的鐵人檔案

poyuanchih的收藏

poyuanchih的追蹤

poyuanchih的Like

poyuanchih的紀錄

poyuanchih的訂閱列表