請問如何用Python辨識FFT轉換後的頻譜圖像 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

0

請問如何用Python辨識FFT轉換後的頻譜圖像

ai影像辨識影像辨識影像分類

E3749 2023-04-17 15:02:07 ‧ 1218 瀏覽

分享至

我個人目前用Python寫的是有關於噪聲辨識的程式，但本人是新手不知道該如何下手目前已能將音頻轉換成WAV並且自動切割時長(15秒分割一次)並做FFT轉換，然後我就卡住了。我想用下圖的輸出圖來做音頻的圖像辨識
現在遇到的問題是若有一段音頻長達三分鐘，意思是分割並轉換的圖像將會有很多，如下圖所示

目前我已經有很多聲音源當資料庫，我需要知道要如何把同一筆資料做分割後的逐一比對並辨識圖像，並能夠輸出辨識結果。
(備註:本人使用的編輯器是Visual Studio Code)

fillano iT邦超人 1 級 ‧ 2023-04-18 09:19:45 檢舉

圖在畫出來之前都是資料，你何苦再把圖轉成資料？資料在產生圖之前就有了吧...你做辨識的目的是？

登入發表討論

熱門推薦

{{ item.subject }}

{{ item.channelVendor }} | {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

1 個回答

1

I code so I am

iT邦高手 1 級 ‧ 2023-04-18 14:28:36

可轉為MFCC或fBank，參閱【Day 25：自動語音識別(Automatic Speech Recognition) -- 觀念與實踐】。

回應
分享
檢舉

登入發表回應

我要發表回答

立即登入回答

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙