前言:踏入 RAG 魔法迷宮 ✨
你是否曾經問 AI 一個問題,卻得到完全不相關或錯誤的答案?傳統 LLM 只能依賴自身訓練時的知識,遇到新資料,它也只能「憑直...
▋前言
語音轉文字是整個系統的基礎。如果逐字稿不準確,後續的語者分離與情緒分析都會失去價值。
▋內容
我們採用了 Whisper 作為 STT 模型,原因有...
幾何變換
當我們在兩張圖片中找到了對應的特徵點後,如何計算出一個能將一張圖片「變形」到另一張圖片視角下的矩陣?這個矩陣稱為單應性矩陣 (homography),...
今天來介紹embedding:
embedding是把文字轉換成一個向量的過程,這樣電腦就可以用數學方式理解它
向量:
它可以是一個維度為 n 的數字陣列例如:...
昨天我們提到 LLM 有三個限制:資料過時、資料來源有限,以及容易產生幻覺。今天要介紹的 RAG(Retrieval-Augmented Generation)...
前情提要
昨天大致上講解了 tokenizer 的部分,這是 LLM 的第一步,但現在這部分很方便直接套用就行。
0. 複習
在開始之前先複習一下高中數學,不管...