iT邦幫忙

2025 iThome 鐵人賽

DAY 15
0

▋前言


由於競賽取得的資料不能對外公開,在接下來的系列文中,我們會開始利用開源語音資料集,來測試系統在不同場景下的表現。

▋內容


預計選用以下三個資料集,來做語音辨識系統的輸入音訊:

  1. AMI Meeting Corpus

    • 多人會議,測試語者分離/識別
  2. Switchboard

    • 雙人電話對話,測試口語化場景
  3. IEMOCAP

    • 情緒語料庫,測試 SER 模組

希望透過更多元的語音類型,來幫助我們檢驗系統在其他語音場景中的表現。這是我們原本在競賽中還沒做的測試,筆者自己也十分期待。

▋下回預告


下一篇將介紹「資料探勘的流程與重要性」,說明當我們要開始使用一個全新的資料集時,應該要先做的事情。

▋參考資料


AMI Corpus
Switchboard
IEMOCAP


上一篇
Day 14 比賽成果分享與反思
系列文
AI語音辨識系統:結合聲紋分析與情緒識別15
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言