iT邦幫忙

鐵人檔案

2024 iThome 鐵人賽
回列表
佛心分享-SideProject30

RAG 和 MongoDB Vector Search 系列

主要介紹Naive RAG & Advanced RAG,並且介紹LLM評估指標RAGAs和利用MongoDB Atlas作為向量資料庫

參賽天數 11 天 | 共 11 篇文章 | 0 人訂閱 訂閱系列文 RSS系列文
DAY 1

主題介紹: 知識庫聊天機器人問答

我是就讀資訊相關科系的大四學生,主要學習數據處理分析和人工智慧模型的應用。 在這次暑假期間因緣際會下加入GAI人工智慧組實習,從中開啟了我對於聊天機器人資料檢索...

2024-09-15 ‧ 由 bensonhsu 分享
DAY 2

MongoDB Atlas

今天要來介紹RAG的大腦:向量資料庫。這裡先簡單介紹一下為什麼要使用向量資料庫,因為在RAG技術當中最核心的概念就是向量。為什麼要用向量後續會說明,現在只要了解...

2024-09-16 ‧ 由 bensonhsu 分享
DAY 3

MongoDB Atlas Compass

今天先來分享我在使用Atlas Compass設定的過程和遇到的問題,會使用到的Compass是因為我認為Compass是最直覺且好瀏覽的資料查閱工具。因為之後...

2024-09-17 ‧ 由 bensonhsu 分享
DAY 4

MongoDB Atlas: Pymongo CRUD

昨天我們介紹了如何設定MongoDB Compass,現在我們就可以比較簡單的去檢視今天進行的操作結果。這邊先補充昨天連線的內容,如果有遇到以下問題可先嘗試一些...

2024-09-18 ‧ 由 bensonhsu 分享
DAY 5

MongoDB Atlas Search Index

今天主要介紹MongoDB Atlas Search,並且介紹Index的強大之處。第一部分會先介紹Search 和Find的差異,接著分享Search的建立和...

2024-09-19 ‧ 由 bensonhsu 分享
DAY 6

切割Chunks 簡介

今天將要開始介紹RAG的基礎組成元素:Chunks,進行RAG的時候最重要的就是「找到」可以幫助LLM回答的資訊。那你可能會想說那為什麼不要直接將文件完整的一份...

2024-09-20 ‧ 由 bensonhsu 分享
DAY 7

使用LangChain模組來進行Chunk切割

今天將會來介紹如何實際針對文本進行文檔的切割,我會使用LangChain所提供的TextSpliter作為切割工具,最終使用pymongo去將文件儲存起來。...

2024-09-21 ‧ 由 bensonhsu 分享
DAY 8

MongoDB Vector Search 前置作業

在第二天的時候有分享MongoDB Atlas作為這次主題的向量資料庫,或許你可能會想說MongoDB 原始設計本就不是專用於向量和進行向量資料查找而設計的資料...

2024-09-22 ‧ 由 bensonhsu 分享
DAY 9

RAG Embedding intro

今天主要來補充一下之前一直沒說到的「文字轉向量」,為什麼要將文字轉成向量來代表文字的意涵?為什麼不要用電腦常用的Unicode或者任何其他編碼原則來表示文字意義...

2024-09-23 ‧ 由 bensonhsu 分享
DAY 10

Naive RAG

今天主要介紹RAG當中的最基礎版本,在使用者問題或檢索的過程中都是使用之前所提到的最初概念,文字切段並且向量化;利用cosine similarity來查詢相關...

2024-09-24 ‧ 由 bensonhsu 分享