iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
AI & Data

AI與語音辨識 系列

想去了解及探索AI及語音之間的關係,在學習當中會把過程及成果放上來,並給與其延伸或者心得,來看看大學生現在都如何學習的吧!

鐵人鍊成 | 共 30 篇文章 | 4 人訂閱 訂閱系列文 RSS系列文
DAY 21

DAY21 語音辨識的前端—VAD篇 part2

你好哇! VAD的簡介 VAD演算法通常形式是給定一幀(10~30ms)音訊資料,輸出該資料中含有語音的機率,在實際操作中,VAD的結果會包含大量雜訊,因此如...

2023-10-06 ‧ 由 meooooow 分享
DAY 22

DAY22 語音辨識的前端—VAD篇 part3

早上好呀!🥴 二、基於高斯混合模型的VAD(之一) 基於高斯混合模型(Gaussian Mixture Model,GMM)的VAD演算法是一種最典型的統計模...

2023-10-07 ‧ 由 meooooow 分享
DAY 23

DAY23 語音辨識的前端—VAD篇 part4

你好! 二、基於高斯混合模型的VAD(之二) 昨天提及WebRTC是由兩個高斯模型組成,而在進行判決時,對每個子頻計算一個二元高斯對數似然比,如下所示: 其中...

2023-10-08 ‧ 由 meooooow 分享
DAY 24

DAY24 語音辨識的前端—VAD篇 part5

早安安! 三、基於神經網路的VAD之一 基於統計模型的演算法主要依賴幾個子頻內預設的能量分布模型,對語音、雜訊進行區分,這在訊號雜訊低、非平穩雜訊的環境中,就...

2023-10-09 ‧ 由 meooooow 分享
DAY 25

DAY25 語音辨識的前端—VAD篇 part6

安安~ 三、基於神經網路的VAD之二 關於昨天的VAD,來用例子補充說明一下: 在64子頻的Gammatone這個例子中,訊號中64個濾波器的中心頻率在對數上...

2023-10-10 ‧ 由 meooooow 分享
DAY 26

DAY26 語音辨識的前端—單通道降噪篇 part1

早上好~ 單通道降噪是一種用於改善語音品質的數位信號處理技術。它的主要目標是在只有單個麥克風或麥克風的音訊通道下,減少環境噪音對語音訊號的干擾。它幫助提高語音...

2023-10-11 ‧ 由 meooooow 分享
DAY 27

DAY27 語音辨識的前端—單通道降噪篇 part2

早安你好! 維納濾波法 維納濾波法(Wiener Filtering)是一種經典的數位信號處理技術,用於單通道降噪,特別是在通信和語音處理領域中應用廣泛。它的...

2023-10-12 ‧ 由 meooooow 分享
DAY 28

DAY28 語音辨識的前端—單通道降噪篇 part3

早上好!今天來介紹MCAR演算法~ MCRA演算法 MCRA(Minimum Controlled Recursive Averaging)是一種經典的單通道...

2023-10-13 ‧ 由 meooooow 分享
DAY 29

DAY29 語音辨識的前端—單通道降噪篇 part4(最後一篇)

早安,今天來講解基於深度學習及神經網路的幾個有名的模型~ 利用深度學習實行單通道降噪 接下來會提及四種神經網路模型,包括RNNoise(Valin,2018)...

2023-10-14 ‧ 由 meooooow 分享
DAY 30

DAY30 語音辨識實作—ChatGPT教我做

嗨囉安安,今天是最後一天,也是一個簡單的小實作。 這次請到了ChatGPT麻麻來手把手教我們如何簡單運用現有套件來執行語音辨識(要我自己從頭開始做大概要一年)...

2023-10-15 ‧ 由 meooooow 分享