把其他類型文件拿來做 chunk → embeddings → 加入 index → 做檢索chunk:把長文章切成多個片段(chunk),通常會設定最大長度...
i> 安裝 Gradio !pip install -q gradio chromadb sentence-transformers ii> 建立...
概念 : Top-k:檢索回傳前 k 筆候選(k 越大 recall 越高但可能 precision 降低);常試 k=1、3、5 相似度分數(score):...
在相同的檢索結果 + prompt 下分別使用: 一個 flan-t5-small 一個 flan-t5-base 比較: 回答語氣(口語 / 正式 /...
實作 : import math import json import os from typing import List, Dict, Optional i...
類型 : 短期記憶(session state):記住本次會話的最近 N 個 turns(用於對話連貫性) 長期記憶(persistent memory):跨...
流程 : 準備 20 筆中文測試 query(每題對應到正確的 FAQ id) 使用sentence-transformers/paraphrase-mult...
概述 FAQ 資料管理(faqs.csv) 對話歷史記錄(SQLite / JSONL 可選) 向量檢索(Sentence-Transformers embe...
完整程式碼 : # ====================================== # 🧱 STEP 0:安裝必要套件 # ===========...