近2年真人語音 Nvidia 有提出不同於TTS的方式, 剛好本人對此有興趣, 但其”模擬環境”內容太新不太明瞭, 不知是否可代為說明介紹如何運用, 可請領”講師費”相關的初步連結如下:
https://github.com/NVIDIA/flowtron
相關新聞 https://www.inside.com.tw/article/24703-nvidia-new-ai-voice-composite-system-rad-tts
老前輩告知: 要找一名工程師,再來上網去下載語音合成模型的開源碼(Open Source),以及搭配的資料集,公開的錄音檔(語料集),裡面甚至會有操作的指引(Recipe)。照著操作手冊一步一步走,最後輸入一個句子進去,就可以聽到語音了。所以, 若能螢幕講解操作, 讓其簡單明瞭就更好了.
可私下mail告知 chen3080@hotmail.com
怕高手太多會很難選擇,所以只會選先回mail的前5名之一。詢問確認可行會回覆選了哪位,以免大家懷疑。
requirements.txt (不太確認是否正確)
matplotlib==3.3.2
numpy==1.19.2
inflect==4.1.0
librosa==0.6.3
scipy==1.5.2
Unidecode==1.0.22
pillow
tensorboardX