【Day 23】Fine-tuning 的一些準備 - huggingface

15th鐵人賽 huggingface fine-tune

1579 瀏覽

上一篇提到我們的模型出來的 CER 並不是非常理想，因此為了讓模型轉錄出來的結果更好，我們需要對模型進行 Fine-tuning，也就是微調我們的模型

在那之前我們可以先知道一個 AI 論壇 —— Huggingface

Huggingface

Huggingface 其實就是一個大家可以在上面討論各種 AI 相關問題，同時也可以把自己做好的模型上架到網站，開放給所有人使用下載

進去上面的 Model 會看到

左邊可以選擇你現在想處理的功能或任務(tasks)，像我現在處理 ASR 的話就會看比較下面的 Audio 那一區，然後選擇 ASR
右邊就會出現能夠處理 ASR 的 model
看到有興趣的就能把它抓下來使用

處理機器學習相關的模型時，資料集絕對是一個非常非常重要的事，所幸 huggingface 也有提供許多 Datasets

這邊稍微提一下，如果想找台灣專門使用的 Datasets，我會推薦去找 mozilla/common_voice

我們可以在 Subset 的地方滑到最底下選擇 zh-TW

下方可以看到每筆資料的資訊，也能夠撥放聲音出來聽聽
我記得 common voice 應該是開放性的，如果你有興趣也可以去他們的網站提供自己的聲音作為 Datasets 的一部分
或是檢測別人的音檔，看是否有說錯的地方，增加這個開源的資料庫

無聊就能上去玩一下，模型訓練的資料真的很難取得QQ

簡單介紹了 huggingface 可以幹嘛，接下來就會玩玩看上面的東西了！

國慶太可怕了，會帶人進入怠惰的深淵，一次要補兩篇...

系列文

深度學習的學習 & ASR 中文語音辨識共 30 篇

2 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

立即登入留言

IT邦幫忙