幾何變換
當我們在兩張圖片中找到了對應的特徵點後,如何計算出一個能將一張圖片「變形」到另一張圖片視角下的矩陣?這個矩陣稱為單應性矩陣 (homography),...
前言:踏入 RAG 魔法迷宮 ✨
你是否曾經問 AI 一個問題,卻得到完全不相關或錯誤的答案?傳統 LLM 只能依賴自身訓練時的知識,遇到新資料,它也只能「憑直...
▋前言
語音轉文字是整個系統的基礎。如果逐字稿不準確,後續的語者分離與情緒分析都會失去價值。
▋內容
我們採用了 Whisper 作為 STT 模型,原因有...
今天來介紹embedding:
embedding是把文字轉換成一個向量的過程,這樣電腦就可以用數學方式理解它
向量:
它可以是一個維度為 n 的數字陣列例如:...
昨天我們提到 LLM 有三個限制:資料過時、資料來源有限,以及容易產生幻覺。今天要介紹的 RAG(Retrieval-Augmented Generation)...
在上一篇我們實作了基礎的 Speed Layer 架構,包含 Source、Sink、SimpleStreamingEngine 三個核心組件。一開始系統運作良...