iT邦幫忙

0

請問如何用Python辨識FFT轉換後的頻譜圖像

  • 分享至 

  • xImage

我個人目前用Python寫的是有關於噪聲辨識的程式,但本人是新手不知道該如何下手目前已能將音頻轉換成WAV並且自動切割時長(15秒分割一次)並做FFT轉換,然後我就卡住了。我想用下圖的輸出圖來做音頻的圖像辨識https://ithelp.ithome.com.tw/upload/images/20230417/20159595DsNd6VBEYq.png
現在遇到的問題是若有一段音頻長達三分鐘,意思是分割並轉換的圖像將會有很多,如下圖所示
https://ithelp.ithome.com.tw/upload/images/20230417/20159595YI3no8MIBn.png
目前我已經有很多聲音源當資料庫,我需要知道要如何把同一筆資料做分割後的逐一比對並辨識圖像,並能夠輸出辨識結果。
(備註:本人使用的編輯器是Visual Studio Code)

fillano iT邦超人 1 級 ‧ 2023-04-18 09:19:45 檢舉
圖在畫出來之前都是資料,你何苦再把圖轉成資料?資料在產生圖之前就有了吧...你做辨識的目的是?
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 個回答

我要發表回答

立即登入回答