iT邦幫忙

2023 iThome 鐵人賽

DAY 16
0
AI & Data

AI與語音辨識系列 第 16

DAY16 語音辨識的基礎,來了解語音訊號part9

  • 分享至 

  • xImage
  •  

早安安呀!


小窗

先前我們談到了所謂倒譜的原理,而知道的頻譜是怎麼運用對數等和諧轉換的,就得回到我們一開始有講過的小窗(可以翻回前一天w(n)的地方)。

所以我們需要考慮的問題就是我們的小窗函數要怎麼選擇,在STFT計算時,任何一個有限長度的窗函數特性不可能一定理想,需要結合窗函數本身的頻域來選擇。最簡單的窗函數是矩形窗(Rectangle),它在窗內的所有係數均為1,窗外所有係數均為0,但因為它太簡單了,所以不太常用,有興趣的可以查看看漢寧漢明布萊克曼等的窗函數。

某些工作中,對訊號的頻譜處理完後需變換回時域波形,如降噪、麥克風陣列波束形成等,這時就會運用到STFT的逆變換,ISTFT,其思路基於IFFT,將頻譜轉變到時域,然後使用重疊相加法形成連續波,想當然,這是理想情況,現實情況是每一幀之間都會形成差異,會有不連續性,聽感上就會有哢噠(ㄌㄨㄥˋㄉㄚˉ)的聲音,為了減少不連續波的產生,在IFFT後重疊相加前會再做一次加小窗,這個窗叫合成窗(synthesis window),換句話說,在STFT階段就是叫做分析窗(analysis window)
完整的頻域訊號處理和重建流程可以參見下圖:
https://ithelp.ithome.com.tw/upload/images/20230928/20161780cQfrWY8lHW.jpg


參考書籍:Hey Siri及Ok Google原理:AI語音辨識專案真應用開發
參考網站:今日無
學習對象:ChatGPT


上一篇
DAY15 語音辨識的基礎,來了解語音訊號part8
下一篇
DAY17 語音辨識的基礎,來了解語音訊號part10(最後一篇)
系列文
AI與語音辨識30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言