iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
AI & Data

AI語音辨識系統:結合聲紋分析與情緒識別 系列

將以 「AI語音辨識系統:結合聲紋分析與情緒識別」 為主題,分享我在 2024 年 AI 競賽的成果。當時與 AI 工程師 Shin-Fu與軟體工程師 Shirley組隊,參加由數位發展部數位產業署主辦的比賽,挑戰透過語音分析提升教學品質,最終獲得首獎(特優獎)。我們的系統能結合聲紋特徵與情緒辨識,分析師生互動中的情緒變化,作為教學品質監控的依據。這次鐵人賽將以 30 天系列文,分享從資料處理、模型設計到應用實作的完整過程,帶大家看 AI & Data 如何真正落地應用。

鐵人鍊成 | 共 30 篇文章 | 4 人訂閱 訂閱系列文 RSS系列文 團隊躺平的內捲小隊
DAY 21

Day 21 模型實驗設計概念與架構規劃

▋前言 在完成資料探勘後,我們接下來要進入實驗設計階段。這一階段的目標是:定義清楚的實驗目標、輸入與評估方式,確保後續的測試與模型比較能有一致性與可信度。 ▋...

2025-10-05 ‧ 由 Harper 分享
DAY 22

Day 22 語音辨識與語者辨識的評估方法

▋前言 要檢驗 AI 語音系統的表現,不能只看準確率。每一個模組都有不同的評估方式。今天我們聚焦兩個核心指標:WER(Word Error Rate) 與 D...

2025-10-06 ‧ 由 Harper 分享
DAY 23

Day 23 情緒分類準確率與整體評估框架

▋前言 在 Day 22 我們介紹了語音與語者層面的評估。今天的焦點是「情緒辨識 (Speech Emotion Recognition)」的評估方式,以及如...

2025-10-07 ‧ 由 Harper 分享
DAY 24

Day 24 AMI Meeting Corpus 資料應用 - 語者標籤錯位問題的發現與原因分析

▋前言 在使用 AMI Meeting Corpus 進行語音分析實驗時,發現一個重要的問題:逐字稿 (ES2002a.Mix-Headset.txt) 裡的...

2025-10-08 ‧ 由 Harper 分享
DAY 25

Day 25 AMI Meeting Corpus 資料應用 - 修正語者標籤邏輯與反思

▋前言 延續昨天的討論,我們已經確定「語者標籤錯位」是由於 embedding 比對排序與 NeMo 輸出順序不一致 所造成。今天我們要嘗試修正這個邏輯,讓語...

2025-10-09 ‧ 由 Harper 分享
DAY 26

Day 26 Switchboard 資料應用 - 雙人錄音的挑戰

▋前言 在前幾天的實驗中,我們使用了 Switchboard 資料集來測試系統的多講者辨識能力。然而,這次遇到了一個特別的狀況:我們取得的音檔並非「混音版本」...

2025-10-10 ‧ 由 Harper 分享
DAY 27

Day 27 Switchboard 資料應用 - 雙人錄音的整合與修正

▋前言 延續昨日的分析,今天我們實際嘗試修正雙人獨立錄音的處理方式,讓系統能正確識別「誰在說話、何時說話、以及雙方的情緒互動」,這是語音 AI 應用落地的重要...

2025-10-11 ‧ 由 Harper 分享
DAY 28

Day 28 IEMOCAP 資料應用 — 系統分析結果

▋前言 在 Switchboard 實驗後,我們將語音辨識系統套用至 IEMOCAP(Interactive Emotional Dyadic Motion...

2025-10-12 ‧ 由 Harper 分享
DAY 29

Day 29 IEMOCAP 資料應用 — 情緒曲線與動態分析

▋前言 昨天我們驗證了系統在 IEMOCAP 對話的靜態情緒分類表現。今天要更進一步觀察整段對話的「情緒曲線」,看看系統能否捕捉人物情緒的起伏與轉折,這對教育...

2025-10-13 ‧ 由 Harper 分享
DAY 30

Day 30 從語音到教育洞察 — AI 語音辨識系統實戰總結

▋前言 30天前,我們從一個簡單的構想出發:「如果能自動分析老師與學生在課堂中的語音互動,是否就能幫助教育平台更客觀地評估教學品質?」 這個構想已被實作成一套...

2025-10-14 ‧ 由 Harper 分享