iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
自我挑戰組

深度學習的學習 & ASR 中文語音辨識 系列

我把在 Coursera 上的 Neural Network & Deep Learning 課程的筆記整理出來,會挑出我有興趣的東西來寫,希望能幫助到同在機器學習這條船上的人們。
同時也會實作 ASR 中文語音辨識,以 Whisper 為主,透過 huggingface 社群強大的力量讓模型產出更好的結果,這段生模型的過程也是有不少東西可以講呢。

鐵人鍊成 | 共 30 篇文章 | 2 人訂閱 訂閱系列文 RSS系列文
DAY 11

【Day 11】深度學習的學習:Normalization

正規化 Normalization 當你現在想找出兩個(以上)數據或特徵的之間關係時,為了不要被單位影響,會把這兩者的數據範圍放到同一個尺度下以利觀察,這就...

2023-09-26 ‧ 由 leo271828 分享
DAY 12

【Day 12】深度學習的學習:mini-batch / Stochestic Gradient Descent

今天要來介紹 mini-batch, Stochestic Gradient Descent 有何差別若是今天訓練集的資料量較大(e.g. m=5,000,00...

2023-09-27 ‧ 由 leo271828 分享
DAY 13

【Day 13】深度學習的學習:Exponentially Weighted Average

Exponentially Weighted (Moving) Average, EWMA指數加權移動平均 EWMA 為了觀察數據,我們今天要來看看 EWM...

2023-09-28 ‧ 由 leo271828 分享
DAY 14

【Day 14】深度學習的學習:Batch Normalization

so called Batch Norm (BN) 在輸入數據時,通常都會先將 feature 做 normalize 後再進行訓練,可以加速模型收斂 而...

2023-09-29 ‧ 由 leo271828 分享
DAY 15

【Day 15】深度學習的學習:Multi Classification

之前講得模型幾乎都是二分法,沒有特別把多元分類的模型拿出來講今天是最後一篇 Deep learning 的筆記,接下來終於要進入實作的文章了,等了好久......

2023-09-30 ‧ 由 leo271828 分享
DAY 16

【Day 16】ASR 中文語音辨識

自動語音辨識(Automatic Speech Recognition, ASR)其實大家應該再熟悉不過了,這個就是語音轉錄的功能最貼切的應用就是,現在打開手機...

2023-10-01 ‧ 由 leo271828 分享
DAY 17

【Day 17】Whisper 使用前的環境建置 - Anaconda

近期開始有比較多不同的 Python 專案,本來都是 Anaconda + Jupyter 爽爽用,環境也是 (base) 一路用到底然後...然後就出事了,因...

2023-10-02 ‧ 由 leo271828 分享
DAY 18

【Day 18】Whisper 使用前的環境設置 - Package

Whisper 若在本地端(Windows)的話,繼續往下從頭看到尾若你用 Colab 的話可以直接跳過下面這 part Windows 先打開 Windows...

2023-10-03 ‧ 由 leo271828 分享
DAY 19

【Day 19】簡單的提高 Whisper 的準確度

昨天轉錄出來的結果不甚滿意,因此我們要用一個簡單的小技巧,或是說小提示,讓我們的模型能做出更精準的轉錄我先拿昨天的程式出來 import whisper lev...

2023-10-04 ‧ 由 leo271828 分享
DAY 20

【Day 20】Whisper 小測試遇到一些問題

後來又多用了幾筆測試,因為 How 哥的影片內容比較前衛,Whisper 辨識程度比較低因此這次我用啾啾鞋的影片做範例用 base, small, medium...

2023-10-05 ‧ 由 leo271828 分享