使用的環境為python3.8 pycharm
經過測試
import speech_recognition as sr
r=sr.Recognizer()
test=sr.AudioFile('vatoy-qmmdj.wav')
with test as source:
audio=r.record(source)
print(r.recognize_google(audio,language='zh-tw'))
上列程式碼可以辨識出內容並精確翻譯
想請問 如果使用即時錄音
可以講預設的錄音檔mp3轉wav檔嗎
https://ithelp.ithome.com.tw/articles/10252078?sc=hot
中有提到相關的方向 不知有沒有在pycharm環境下直接設定的步驟
或是更改程式碼的可能
之前有在樹梅派上面透過麥克風在做類似功能
可以參考
https://coolmandiary.blogspot.com/2017/06/virtual-assistant-ttsstt.html
記得是有需要用到
PortAudio (MIT License)
跨平台(Windows 、Unix、OS X) 的控制音檔 I/O 的 OpenSource
PyAudio 則是 和他有相關的 Python 套件
可以用它去驅使Python 做 語音錄製後的STT後續功能
外接麥克風則是ALSA相關音源套件
https://coolmandiary.blogspot.com/2017/06/blog-post_25.html