AI與語音辨識 :: 2023 iThome 鐵人賽

meooooow (meooooow)

iT邦見習生 ‧ 點數 144

6499

累計瀏覽數

6人

在追蹤

站內簡訊追蹤

鐵人檔案

2023 iThome 鐵人賽

回列表

AI & Data

AI與語音辨識系列

想去了解及探索AI及語音之間的關係，在學習當中會把過程及成果放上來，並給與其延伸或者心得，來看看大學生現在都如何學習的吧！

鐵人鍊成｜共 30 篇文章｜ 3 人訂閱訂閱系列文 RSS系列文

0 Like 0 留言 1607 瀏覽

DAY 21

DAY21 語音辨識的前端—VAD篇 part2

你好哇！ VAD的簡介 VAD演算法通常形式是給定一幀（10～30ms）音訊資料，輸出該資料中含有語音的機率，在實際操作中，VAD的結果會包含大量雜訊，因此如...

2023-10-06 ‧ 由 meooooow 分享

0 Like 0 留言 926 瀏覽

DAY 22

DAY22 語音辨識的前端—VAD篇 part3

早上好呀！🥴 二、基於高斯混合模型的VAD（之一）基於高斯混合模型（Gaussian Mixture Model，GMM）的VAD演算法是一種最典型的統計模...

2023-10-07 ‧ 由 meooooow 分享

0 Like 0 留言 1067 瀏覽

DAY 23

DAY23 語音辨識的前端—VAD篇 part4

你好！二、基於高斯混合模型的VAD（之二）昨天提及WebRTC是由兩個高斯模型組成，而在進行判決時，對每個子頻計算一個二元高斯對數似然比，如下所示：其中...

2023-10-08 ‧ 由 meooooow 分享

0 Like 0 留言 1181 瀏覽

DAY 24

DAY24 語音辨識的前端—VAD篇 part5

早安安！三、基於神經網路的VAD之一基於統計模型的演算法主要依賴幾個子頻內預設的能量分布模型，對語音、雜訊進行區分，這在訊號雜訊低、非平穩雜訊的環境中，就...

2023-10-09 ‧ 由 meooooow 分享

0 Like 0 留言 887 瀏覽

DAY 25

DAY25 語音辨識的前端—VAD篇 part6

安安～三、基於神經網路的VAD之二關於昨天的VAD，來用例子補充說明一下：在64子頻的Gammatone這個例子中，訊號中64個濾波器的中心頻率在對數上...

2023-10-10 ‧ 由 meooooow 分享

0 Like 0 留言 1176 瀏覽

DAY 26

DAY26 語音辨識的前端—單通道降噪篇 part1

早上好～單通道降噪是一種用於改善語音品質的數位信號處理技術。它的主要目標是在只有單個麥克風或麥克風的音訊通道下，減少環境噪音對語音訊號的干擾。它幫助提高語音...

2023-10-11 ‧ 由 meooooow 分享

0 Like 0 留言 1620 瀏覽

DAY 27

DAY27 語音辨識的前端—單通道降噪篇 part2

早安你好！維納濾波法維納濾波法（Wiener Filtering）是一種經典的數位信號處理技術，用於單通道降噪，特別是在通信和語音處理領域中應用廣泛。它的...

2023-10-12 ‧ 由 meooooow 分享

0 Like 0 留言 1407 瀏覽

DAY 28

DAY28 語音辨識的前端—單通道降噪篇 part3

早上好！今天來介紹MCAR演算法～ MCRA演算法 MCRA（Minimum Controlled Recursive Averaging）是一種經典的單通道...

2023-10-13 ‧ 由 meooooow 分享

0 Like 0 留言 1724 瀏覽

DAY 29

DAY29 語音辨識的前端—單通道降噪篇 part4（最後一篇）

早安，今天來講解基於深度學習及神經網路的幾個有名的模型～利用深度學習實行單通道降噪接下來會提及四種神經網路模型，包括RNNoise（Valin，2018）...

2023-10-14 ‧ 由 meooooow 分享

0 Like 0 留言 3268 瀏覽

DAY 30

DAY30 語音辨識實作—ChatGPT教我做

嗨囉安安，今天是最後一天，也是一個簡單的小實作。這次請到了ChatGPT麻麻來手把手教我們如何簡單運用現有套件來執行語音辨識（要我自己從頭開始做大概要一年）...

2023-10-15 ‧ 由 meooooow 分享

meooooow的鐵人檔案

meooooow的收藏

meooooow的追蹤

meooooow的Like

meooooow的紀錄

meooooow的訂閱列表

鐵人檔案

AI與語音辨識 系列

標記使用者

AI與語音辨識系列