iT邦幫忙

2025 iThome 鐵人賽

DAY 3
0

一、為什麼要使用FAISS向量資料庫

傳統的資料庫擅長處理結構化的表格資料,你可以根據精確的關鍵字來查詢。但對於旅遊這樣充滿描述性文字、 需要理解語意和上下文的資訊,傳統資料庫就顯得力不從心。

向量資料庫則是為了解決這個問題而生。它儲存的不是一般的文字或數字,而是將文字、圖片、音訊等等轉換 成一串串向量。這些向量就像是資訊的指紋,能夠捕捉到資訊的語意特徵。

二、FAISS的基本概念

FAISS是一個高效向量搜尋函式庫,專門解決「如何在海量向量中快速找到與給定向量最相似的向量」這個問題而 設計。

FAISS有三個基礎概念:

  • 向量:是文字或資料的數值表示,這些向量通常是浮點數組成的陣列。
  • 索引:索引是一種資料結構,它能讓FAISS極快地找到與查詢向量最相似的向量,而不需要逐一比對 所有向量。
  • 相似度搜尋:FAISS可以根據不同的距離度量來找到最相似的向量。

三、FAISS在RAG中的重要性

在 RAG架構中,FAISS扮演著**「知識檢索器」**的角色。
為什麼 FAISS 在 RAG 中如此重要?

  • 準確性:透過尋找語意上最相關的資訊,FAISS確保LLM獲得的上下文是精準的,提高LLM回答的準確性,避免 「幻覺」(hallucination)。
  • 時效性:當你需要更新旅遊資訊時,你只需要更新FAISS資料庫中的部分向量,而不需要重新訓練整個LLM。可 以讓你的知識庫能夠保持最新的狀態。
  • 效率:FAISS的快速搜尋能力,保證了整個RAG系統能夠在合理的時長內給出回應,提高使用者的體驗。

今天我們了解FAISS的基本原理和它在RAG架構中的角色
明天,我們將探討如何從這些資料中生成訓練用的問答對,謝謝各位今天的觀看。
夏目黑臉


上一篇
【Day2】建置開發環境
下一篇
【Day4】資料的來源:從台灣政府公開資料集獲取旅遊資訊
系列文
智慧旅遊顧問--結合 LLM 與 RAG 架構的台灣旅遊資訊助手9
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言