iT邦幫忙

鐵人檔案

2024 iThome 鐵人賽
回列表
生成式 AI

使用 Spring AI 打造企業 RAG 知識庫 系列

Spring AI 在2024年2月推出了 0.8 版,不到半年就迅速更新到 1.0.0-M1,其發展速度與 AI 同樣迅速。
實際使用後,發現它與 LangChain4j 有幾分神似。
希望藉由鐵人賽讓大家知道 Spring 也有 AI 框架,透過 SpringBoot 的整合.可輕易串接不同模組,讓企業導入 AI 甚至整合 AI 不在只是一個願景

鐵人鍊成 | 共 35 篇文章 | 38 人訂閱 訂閱系列文 RSS系列文
DAY 21

使用 Spring AI 打造企業 RAG 知識庫【21】- 安裝 Neo4j 向量資料庫(docker)

鯨魚是開發測試的好朋友 Day19 有兩個 Advisor 還沒說,分別是 VectorStoreChatMemoryAdvisor 及 QuestionAns...

2024-08-21 ‧ 由 凱文大叔 分享
DAY 22

使用 Spring AI 打造企業 RAG 知識庫【22】- 使用向量資料庫作為對話的長久記憶

今天其實在幫Spring AI Debug 沒接觸 AI 前,儲存對話只會透過 SQL 或 NoSQL 資料庫儲存對話內容,查詢資料也只能使用關鍵字搜尋,只要關...

2024-08-22 ‧ 由 凱文大叔 分享
DAY 23

使用 Spring AI 打造企業 RAG 知識庫【23】- 如何將內容向量化

Embedding是塞了甚麼? 剛看到 Embedding 這個名詞一直無法跟向量化聯想在一起,直到看了台大教授陳縕儂的影片才瞭解其中含意,有興趣的朋友可自行...

2024-08-23 ‧ 由 凱文大叔 分享
DAY 24

使用 Spring AI 打造企業 RAG 知識庫【24】- RAG流程詳解

Spring就是封裝高手 之前的章節幾乎涵蓋了 Spring AI 的基本功能,是時候向下一個里程邁進了,接下來就是企業應用的重頭戲-RAG 先來看看 Spr...

2024-08-24 ‧ 由 凱文大叔 分享
DAY 25

使用 Spring AI 打造企業 RAG 知識庫【25】- RAG 的知識來源 - ETL (上)

從ETL開始燒錢 原廠資料把這一塊稱為 ETL pipeline,為什麼後面要加 pipeline ? 看下面官方的圖片就一目了然 上圖藍色部分分別對應三個介...

2024-08-25 ‧ 由 凱文大叔 分享
DAY 26

使用 Spring AI 打造企業 RAG 知識庫【26】- 擷取進階文件類型 - ETL(中)

把所有檔案都向量化 延續昨天的主題,今天要處理的文件內容比昨天複雜,分別是 PDF:PagePdfDocumentReader、ParagraphPdfDocu...

2024-08-26 ‧ 由 凱文大叔 分享
DAY 27

使用 Spring AI 打造企業 RAG 知識庫【27】- 給向量資料加上Buff-ETL(下)

嵌套俄羅斯娃娃 回顧一下 ETL Pipeline 中間那一塊前面只用到 TokenTextSplitter 將大檔案切成小塊,今天來詳細的介紹這些工具有甚麼功...

2024-08-27 ‧ 由 凱文大叔 分享
DAY 28

使用 Spring AI 打造企業 RAG 知識庫【28】- 企業RAG真正的資料來源

外部資料才用ETL,內部資料直接從資料庫抓 前幾天主要在說明如何從電子檔案擷取資料匯入向量資料庫,不過企業最大宗的資料卻都在一般的資料庫上,今天就來說說如何從一...

2024-08-28 ‧ 由 凱文大叔 分享
DAY 29

使用 Spring AI 打造企業 RAG 知識庫【29】- RAG的最後一哩路

所有的準備都是為了最後的演出 前面已詳述過 RAG 最主要的目的,就是提供 LLM 未知的資訊,而這些資料會使用 ETL 技術或是由企業資料庫中取得,經過 e...

2024-08-29 ‧ 由 凱文大叔 分享
DAY 30

使用 Spring AI 打造企業 RAG 知識庫【30】- 是結束也是開始

期待Spring AI能找到自己的特色 在鐵人賽尾聲,Spring AI 還釋出了 1.0.0 M2 版本,在這個版本多了評估( Evaluator )跟節制...

2024-08-30 ‧ 由 凱文大叔 分享