▋前言
由於競賽取得的資料不能對外公開,在接下來的系列文中,我們會開始利用開源語音資料集,來測試系統在不同場景下的表現。
▋內容
預計選用以下三個資料集,來做語音辨識系統的輸入音訊:
AMI Meeting Corpus
Switchboard
IEMOCAP
希望透過更多元的語音類型,來幫助我們檢驗系統在其他語音場景中的表現。這是我們原本在競賽中還沒做的測試,筆者自己也十分期待。
▋下回預告
下一篇將介紹「資料探勘的流程與重要性」,說明當我們要開始使用一個全新的資料集時,應該要先做的事情。
▋參考資料