昨天,我們成功為 AI 助理裝上了「耳朵」(Webhook),讓它能聽懂我們從外部下達的研究指令。
但現在的它,就像一個博學多聞、卻被關在圖書館裡的老教授。你問...
把「聲音 → 文字」流程:收集資料:大量的語音錄音 + 對應逐字稿(最好有多種口音、音量、背景雜訊)資料前處理:降噪、切分語音片段,把音檔轉成 梅爾頻譜 (Me...
LLM(Large Language Model) 是透過大量語料學習「下一個token」的機率,具備語言理解與生成的能力。
昨天提到的 In-Context...
VAE 雖然能生成多樣化的結果,但其生成的圖片(尤其是複雜圖片)往往比較模糊,缺乏細節。如果我們不追求像素級別的重建,而是以以假亂真為目標,那麼 GAN 就是我...
資料湖與湖倉
為了解決上述資料倉儲所遭遇之問題,工程師們發展出了資料湖 (Data Lake)這種分析架構,從上圖可以得知資料湖的特性:
*Open fi...
在前幾天的文章中,我們依序介紹了 RNN、LSTM、GRU,並討論它們如何建模序列資料。這些模型能夠捕捉序列中的上下文關係,並緩解傳統 RNN 的梯度消失問題。...