2025 iThome 鐵人賽
沒在獨自升級的 一起來
AI & Data
選手 74 文章 1473
Day 7
2025-09-14
305
0
前言:踏入 RAG 魔法迷宮 ✨ 你是否曾經問 AI 一個問題,卻得到完全不相關或錯誤的答案?傳統 LLM 只能依賴自身訓練時的知識,遇到新資料,它也只能「憑直...
Day 5
2025-09-19
305
0
▋前言 語音轉文字是整個系統的基礎。如果逐字稿不準確,後續的語者分離與情緒分析都會失去價值。 ▋內容 我們採用了 Whisper 作為 STT 模型,原因有...
Day 8
2025-08-18
305
0
幾何變換 當我們在兩張圖片中找到了對應的特徵點後,如何計算出一個能將一張圖片「變形」到另一張圖片視角下的矩陣?這個矩陣稱為單應性矩陣 (homography),...
Day 5
2025-08-07
304
0
今天來介紹embedding: embedding是把文字轉換成一個向量的過程,這樣電腦就可以用數學方式理解它 向量: 它可以是一個維度為 n 的數字陣列例如:...
Day 2
2025-09-16
304
0
昨天我們提到 LLM 有三個限制:資料過時、資料來源有限,以及容易產生幻覺。今天要介紹的 RAG(Retrieval-Augmented Generation)...
Day 4
2025-08-29
304
0
前情提要 昨天大致上講解了 tokenizer 的部分,這是 LLM 的第一步,但現在這部分很方便直接套用就行。 0. 複習 在開始之前先複習一下高中數學,不管...