早安安呀!
先前我們談到了所謂倒譜的原理,而知道的頻譜是怎麼運用對數等和諧轉換的,就得回到我們一開始有講過的小窗(可以翻回前一天w(n)的地方)。
所以我們需要考慮的問題就是我們的小窗函數要怎麼選擇,在STFT計算時,任何一個有限長度的窗函數特性不可能一定理想,需要結合窗函數本身的頻域來選擇。最簡單的窗函數是矩形窗(Rectangle),它在窗內的所有係數均為1,窗外所有係數均為0,但因為它太簡單了,所以不太常用,有興趣的可以查看看漢寧、漢明及布萊克曼等的窗函數。
某些工作中,對訊號的頻譜處理完後需變換回時域波形,如降噪、麥克風陣列波束形成等,這時就會運用到STFT的逆變換,ISTFT,其思路基於IFFT,將頻譜轉變到時域,然後使用重疊相加法形成連續波,想當然,這是理想情況,現實情況是每一幀之間都會形成差異,會有不連續性,聽感上就會有哢噠(ㄌㄨㄥˋㄉㄚˉ)的聲音,為了減少不連續波的產生,在IFFT後重疊相加前會再做一次加小窗,這個窗叫合成窗(synthesis window),換句話說,在STFT階段就是叫做分析窗(analysis window)。
完整的頻域訊號處理和重建流程可以參見下圖:
參考書籍:Hey Siri及Ok Google原理:AI語音辨識專案真應用開發
參考網站:今日無
學習對象:ChatGPT