iT邦幫忙

2025 iThome 鐵人賽

DAY 7
0
AI & Data

AI初學者入門系列 第 7

Day7 介紹FAISS 並儲存查詢

  • 分享至 

  • xImage
  •  

首先,我今天想介紹FAISS,它是相似度搜尋庫,是由facebook所開發的,主要用來在大量的向量資料中快速找到並查詢向量最相似的項目,但缺點是不具備資料庫的功能。

我開始介紹要如何做一個小小的範例:
用FAISS 將句子轉為向量後儲存與查詢

  1. pip install faiss-cpu sentence-transformers(用來向量化句子)

  2. 載入句向量模型、FAISS 向量索引、NumPy 陣列工具
    https://ithelp.ithome.com.tw/upload/images/20250809/20177905Y2wTf0XXWH.png

  3. 建立句子
    https://ithelp.ithome.com.tw/upload/images/20250809/20177905p4rR5yAsrH.png

  4. 我這裡用小和快的模型運作(all-MiniLM-L6-v2)(每個句子是384 維),把三個句子都轉成 各384 維的向量
    https://ithelp.ithome.com.tw/upload/images/20250809/20177905DTNNA3BGn8.png

  5. 建一個用 L2 距離的索引,並用 L2(歐氏距離)當相似度度量。
    歐氏距離就是高中的找出最短距離公式:數字越小越相似
    https://ithelp.ithome.com.tw/upload/images/20250809/20177905cEWMWJ8x9B.png

  6. 三個句子的向量加到 FAISS 索引
    https://ithelp.ithome.com.tw/upload/images/20250809/20177905mBZU63GqZE.png

  7. 查詢相似句子,我選最相近的兩個句子
    https://ithelp.ithome.com.tw/upload/images/20250809/20177905EA8WTh2bou.png

  8. 顯示結果
    https://ithelp.ithome.com.tw/upload/images/20250809/20177905yKGKUjCsra.png

這是我最後輸出的樣子
https://ithelp.ithome.com.tw/upload/images/20250809/201779050qSvjlW0CP.png

明天會講到另一種有加上具備資料庫的Chroma~~


上一篇
Day6 使用 OpenAI Embedding API
下一篇
Day8 Chroma 向量資料庫
系列文
AI初學者入門30
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言