深度學習的學習 & ASR 中文語音辨識 :: 2023 iThome 鐵人賽

leo271828 (leo271828)

iT邦見習生 ‧ 點數 192

6067

累計瀏覽數

站內簡訊追蹤

鐵人檔案

2023 iThome 鐵人賽

回列表

自我挑戰組

深度學習的學習 & ASR 中文語音辨識系列

我把在 Coursera 上的 Neural Network & Deep Learning 課程的筆記整理出來，會挑出我有興趣的東西來寫，希望能幫助到同在機器學習這條船上的人們。
同時也會實作 ASR 中文語音辨識，以 Whisper 為主，透過 huggingface 社群強大的力量讓模型產出更好的結果，這段生模型的過程也是有不少東西可以講呢。

鐵人鍊成｜共 30 篇文章｜ 2 人訂閱訂閱系列文 RSS系列文

0 Like 0 留言 725 瀏覽

DAY 11

【Day 11】深度學習的學習：Normalization

正規化 Normalization 當你現在想找出兩個(以上)數據或特徵的之間關係時，為了不要被單位影響，會把這兩者的數據範圍放到同一個尺度下以利觀察，這就...

2023-09-26 ‧ 由 leo271828 分享

0 Like 0 留言 1079 瀏覽

DAY 12

【Day 12】深度學習的學習：mini-batch / Stochestic Gradient Descent

今天要來介紹 mini-batch, Stochestic Gradient Descent 有何差別若是今天訓練集的資料量較大(e.g. m=5,000,00...

2023-09-27 ‧ 由 leo271828 分享

0 Like 0 留言 2871 瀏覽

DAY 13

【Day 13】深度學習的學習：Exponentially Weighted Average

Exponentially Weighted (Moving) Average, EWMA指數加權移動平均 EWMA 為了觀察數據，我們今天要來看看 EWM...

2023-09-28 ‧ 由 leo271828 分享

0 Like 0 留言 521 瀏覽

DAY 14

【Day 14】深度學習的學習：Batch Normalization

so called Batch Norm (BN) 在輸入數據時，通常都會先將 feature 做 normalize 後再進行訓練，可以加速模型收斂而...

2023-09-29 ‧ 由 leo271828 分享

0 Like 0 留言 581 瀏覽

DAY 15

【Day 15】深度學習的學習：Multi Classification

之前講得模型幾乎都是二分法，沒有特別把多元分類的模型拿出來講今天是最後一篇 Deep learning 的筆記，接下來終於要進入實作的文章了，等了好久......

2023-09-30 ‧ 由 leo271828 分享

0 Like 0 留言 1193 瀏覽

DAY 16

【Day 16】ASR 中文語音辨識

自動語音辨識(Automatic Speech Recognition, ASR)其實大家應該再熟悉不過了，這個就是語音轉錄的功能最貼切的應用就是，現在打開手機...

2023-10-01 ‧ 由 leo271828 分享

0 Like 0 留言 1683 瀏覽

DAY 17

【Day 17】Whisper 使用前的環境建置 - Anaconda

近期開始有比較多不同的 Python 專案，本來都是 Anaconda + Jupyter 爽爽用，環境也是 (base) 一路用到底然後...然後就出事了，因...

2023-10-02 ‧ 由 leo271828 分享

0 Like 0 留言 1283 瀏覽

DAY 18

【Day 18】Whisper 使用前的環境設置 - Package

Whisper 若在本地端(Windows)的話，繼續往下從頭看到尾若你用 Colab 的話可以直接跳過下面這 part Windows 先打開 Windows...

2023-10-03 ‧ 由 leo271828 分享

0 Like 0 留言 2873 瀏覽

DAY 19

【Day 19】簡單的提高 Whisper 的準確度

昨天轉錄出來的結果不甚滿意，因此我們要用一個簡單的小技巧，或是說小提示，讓我們的模型能做出更精準的轉錄我先拿昨天的程式出來 import whisper lev...

2023-10-04 ‧ 由 leo271828 分享

0 Like 0 留言 1071 瀏覽

DAY 20

【Day 20】Whisper 小測試遇到一些問題

後來又多用了幾筆測試，因為 How 哥的影片內容比較前衛，Whisper 辨識程度比較低因此這次我用啾啾鞋的影片做範例用 base, small, medium...

2023-10-05 ‧ 由 leo271828 分享

leo271828的鐵人檔案

leo271828的收藏

leo271828的追蹤

leo271828的Like

leo271828的紀錄

leo271828的訂閱列表