將以 「AI語音辨識系統:結合聲紋分析與情緒識別」 為主題,分享我在 2024 年 AI 競賽的成果。當時與 AI 工程師 Shin-Fu與軟體工程師 Shirley組隊,參加由數位發展部數位產業署主辦的比賽,挑戰透過語音分析提升教學品質,最終獲得首獎(特優獎)。我們的系統能結合聲紋特徵與情緒辨識,分析師生互動中的情緒變化,作為教學品質監控的依據。這次鐵人賽將以 30 天系列文,分享從資料處理、模型設計到應用實作的完整過程,帶大家看 AI & Data 如何真正落地應用。
▋前言 前十天我們拆解了系統架構、四大模組,以及過程中的優化。今天要回到競賽的成果報告,看看整個系統如何整合,最終生成完整的課程品質分析報告。 ▋內容 在比...
▋前言 在系統中,我們不只要做逐字稿與情緒分析,還希望能生成「教學摘要」與「學習建議」。這就需要引入大型語言模型 (LLM)。 ▋內容 比賽有一個限制:不得...
▋前言 經過數月開發與競賽挑戰,我們的 AI 語音辨識系統最終成功整合多個模組,並且在比賽評審結果中受到了正向的肯定。今天回顧成果,並展望未來應用。 ▋內容...
▋前言 參加這場 AI 競賽,對我們團隊而言是一場收穫豐富的旅程。今天要分享心得與建議。 ▋內容 收穫 團隊合作:技能互補,分工高效 實戰經驗:將理...
▋前言 由於競賽取得的資料不能對外公開,在接下來的系列文中,我們會開始利用開源語音資料集,來測試系統在不同場景下的表現。 ▋內容 預計選用以下三個資料集,來...
▋前言 在執行 AI 專案時,容易不小心就急著「丟資料進模型」,但如果沒有先做 資料探勘 (Exploratory Data Analysis, EDA),最...
▋前言 在 Day 16 我們談到資料探勘 (EDA) 的一般流程。今天,我們要把這些步驟實際應用在 AMI Meeting Corpus —— 一個包含多講...
▋前言 在 Day 16–17 我們談到資料探勘的步驟與 Mozilla Common Voice 的語料特性。今天開始,我們將切換到另一個更貼近「雙人自然對...
▋前言 光有逐字稿還不夠,要理解學生的「情緒」才是教育場景的核心之一。IEMOCAP 是一個專門為情緒辨識設計的語音資料集,今天我們就來看看它的結構。 ▋內容...
▋前言 在過去幾天,我們對 AMI、Switchboard、IEMOCAP 三個資料集做了資料探勘。今天,我們要把這些經驗整合起來,形成一個「資料 → 前處理...