2023 iThome 鐵人賽

DAY 25

自我挑戰組

深度學習的學習 & ASR 中文語音辨識系列第 25 篇

【Day 25】Fine-tuning 的一些準備 - huggingface 上的 Whisper model (cont.)

15th鐵人賽 huggingface fine-tuning

leo271828

2023-10-10 23:59:29

1046 瀏覽

分享至

結果發現我在搞耍，前面的 librosa 下載到 base 環境
補完之後依舊出現了其他問題

RuntimeError: Decoding 'mp3' files requires system library 'libsndfile'>=1.1.0, You can try to update `soundfile` python library: `pip install "soundfile>=0.12.1"`.

於是就照著他講的去做，結果還是一樣，確認一下目前版本

pip show soundfile

出來的版本也是寫 0.12.1，究竟是為甚麼呢
還在想...

#更 Day 30
我想到了啦！！！好像電腦重開機就可以了！！！
每次都被這種奇怪的東西卡住= =
總之可以繼續了！

如果照著原本的打

# generate token ids
predicted_ids = model.generate(input_features, forced_decoder_ids=forced_decoder_ids)
# decode token ids to text
transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)

print(transcription)

給他跑一下，transcription 就會印出

'兩國總統都沒有直接通過電話。'

成功印出中文！可喜可賀

Ref.

https://huggingface.co/blog/fine-tune-whisper

【Day 24】Fine-tuning 的一些準備 - huggingface 上的 Whisper model

【Day 26】Whisper model 的快樂 Fine-tuning 時間

系列文

深度學習的學習 & ASR 中文語音辨識共 30 篇

RSS系列文訂閱系列文

2 人訂閱

完整目錄

直播研討會

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22199 篇

完賽人數

600 人

台灣大哥大OTA介紹＆差分 OTA 技術於能源管理應用之導入

IT EXPLAINED |

37 分

迎向未來體驗：雲遊戲、元宇宙

IT EXPLAINED |

40 分

基於LLM模型的 AI Agent 從零到進階實踐

Hello World Dev Conference |

42 分

資料上雲時代：企業該如何建構堅固的安全防線

Cloud Summit 臺灣雲端大會 |

28 分

數位銀行詐欺與銀行面臨的漏洞所帶來的挑戰以及 AI 如何幫助

臺灣資安大會 |

30 分

Angular 17 全新檢測變更機制 - Signal

iThome鐵人賽 |

38 分

Cloudflare核心產品DDoS Protection與創新研發API Shield助力企業全方位應對安全威脅

IT EXPLAINED |

30 分

Citrix 多工虛擬化解決方案協助企業增進生產力

Cloud Summit 臺灣雲端大會 |

24 分

如何強化企業應用安全及落實風險管理

臺灣資安大會 |

26 分

Netflix 如何用機器學習技術加速影片創作

iThome鐵人賽 |

29 分

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙

深度學習的學習 & ASR 中文語音辨識系列 第 25 篇

【Day 25】Fine-tuning 的一些準備 - huggingface 上的 Whisper model (cont.)

Ref.

尚未有邦友留言

標記使用者

深度學習的學習 & ASR 中文語音辨識系列第 25 篇