iT邦幫忙

2023 iThome 鐵人賽

DAY 25
0
自我挑戰組

深度學習的學習 & ASR 中文語音辨識系列 第 25

【Day 25】Fine-tuning 的一些準備 - huggingface 上的 Whisper model (cont.)

  • 分享至 

  • xImage
  •  

結果發現我在搞耍,前面的 librosa 下載到 base 環境
補完之後依舊出現了其他問題

RuntimeError: Decoding 'mp3' files requires system library 'libsndfile'>=1.1.0, You can try to update `soundfile` python library: `pip install "soundfile>=0.12.1"`. 

於是就照著他講的去做,結果還是一樣,確認一下目前版本

pip show soundfile

出來的版本也是寫 0.12.1,究竟是為甚麼呢
還在想...

#更 Day 30
我想到了啦!!!好像電腦重開機就可以了!!!
每次都被這種奇怪的東西卡住= =
總之可以繼續了!

如果照著原本的打

# generate token ids
predicted_ids = model.generate(input_features, forced_decoder_ids=forced_decoder_ids)
# decode token ids to text
transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)

print(transcription)

給他跑一下,transcription 就會印出

'兩國總統都沒有直接通過電話。'

成功印出中文!可喜可賀

Ref.


上一篇
【Day 24】Fine-tuning 的一些準備 - huggingface 上的 Whisper model
下一篇
【Day 26】Whisper model 的快樂 Fine-tuning 時間
系列文
深度學習的學習 & ASR 中文語音辨識30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言