iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
AI & Data

RAG × Agent:從知識檢索到智慧應用的30天挑戰 系列

這次挑戰中,我以RAG × Agent:從知識檢索到智慧應用的30天挑戰」為主題,試想紀錄自己從零開始學習檢索式生成 (Retrieval-Augmented Generation, RAG) 的過程。
內容會包含幾個部分,先從探索RAG的基礎原理開始,最後希望可以進一步延伸到 AI Agent 的應用。

參賽天數 23 天 | 共 23 篇文章 | 0 人訂閱 訂閱系列文 RSS系列文
DAY 1

Day 1|什麼是 RAG?

在第一天,我想先從基礎先談起。大家可能都聽過生成式 AI 像是 (ChatGPT),有時候使用完他可能也是在「亂編答案」,不見得能夠一步到位就生成你想要的問題,...

2025-09-15 ‧ 由 otterday 分享
DAY 2

Day 2|RAG 的基本架構

昨天我們提到 LLM 有三個限制:資料過時、資料來源有限,以及容易產生幻覺。今天要介紹的 RAG(Retrieval-Augmented Generation)...

2025-09-16 ‧ 由 otterday 分享
DAY 3

Day 3|Indexing pipeline:如何為 RAG 建立知識庫

昨天看到 RAG 架構,今天要更深入,看看如何建立知識庫。 我們先看這張圖來逐一拆解他的步驟:來源:Build a Retrieval Augmented Ge...

2025-09-17 ‧ 由 otterday 分享
DAY 4

Day 4|Embedding 是什麼?——如何把文字變成數字空間

昨天把 Indexing pipeline 跑過一遍:從資料載入、Chunking、Embeddings,到向量資料庫。要讓 RAG 找到「對的內容」,關鍵在第...

2025-09-18 ‧ 由 otterday 分享
DAY 5

Day 5|射箭還是量尺?——AI 如何判斷文字的相似度

怕大家突然看到這篇會不知道為什麼跳到這部分,如果是新來的朋友想了解詳細流程,可以先回顧我之前第三天的文章:Day 3|Indexing pipeline:如何為...

2025-09-19 ‧ 由 otterday 分享
DAY 6

Day 6|只是存資料?——向量資料庫比你想的還厲害

新來的朋友,一樣先建議先回顧先前的文章,才會比較明白整個 Indexing pipeline 的流程以及這章是在哪個環節噢!文章在這:Day 3|Indexin...

2025-09-20 ‧ 由 otterday 分享
DAY 7

Day 7|Generation pipeline:AI 如何把知識取出來用

之前我們已經討論過 Indexing pipeline 是怎麼把知識存進去,現在就要來看 Generation pipeline 如何把知識「取出來用」。這邊可...

2025-09-21 ‧ 由 otterday 分享
DAY 8

Day 8|檢索方式——AI 應該怎麼樣選擇「誰來幫它找資料」呢?

在 Day 7|Generation pipeline:AI 如何把知識取出來用 有說到檢索方式其實有很多種,今天就來介紹幾種常見的檢索方式。 1. TF-...

2025-09-22 ‧ 由 otterday 分享
DAY 9

Day 9|Prompt Engineering——設計好問題,AI 才能給好答案

延續 Day 7|Generation pipeline:AI 如何把知識取出來用 的內容,這邊要講到 Prompt Engineering,這邊會很重要的原因...

2025-09-23 ‧ 由 otterday 分享
DAY 10

Day 10|小總結 & 實作規劃——我的第一個 RAG Pipeline 要長什麼樣?

新來的朋友,建議可以先回顧前幾天的文章,之前已經分別聊過 RAG 的兩大流程: Indexing pipeline:資料怎麼被處理、切割、轉換成向量,最後存進...

2025-09-24 ‧ 由 otterday 分享