iT邦幫忙

2022 iThome 鐵人賽

DAY 1
0
自我挑戰組

鐵人挑戰系列 第 1

Day1- 文字轉語音

  • 分享至 

  • xImage
  •  

Day1

今天實作用python做文字轉語音,且要以不同語音來製作語音包,目前暫時做出以文字轉語音,以google的gtts來實作,做出了google語音的文字轉語音,離我目前目標尚且遙遠,在查詢了大量的網頁以及大量資料,發現大部分語音包都來自中國大陸,目前要使用語音包暫且有點困難,需要知道,語音部分到底如何製作,需要往更源頭方向尋找答案。
而後找到了pyttsx3模組製作看看,文字轉語音的部分,我想該找看看變聲器的使用方法,而後套上語音輸出的資料,利用這樣的想法來使得語音包呈現。
我使用了Azure製作能不能改變語音,宣告失敗。
而後我使用微軟語音包,測試能不能網路上找到相關的資料,或許有人自製語音包,而我可以利用這個,做出屬於自己的語音包,改變聲音語氣,若是不行,我也許會選擇自行利用語音合成來製作出自己該選擇好的東西,今天的第一天,想利用輸出的文字變成語音,做了8個程式,找了無數的相關網站,雖然看起來不算特別難,但是關於語氣語調的方面,以及最困難的分詞斷句我可能需要更多時間研究才能完成這個工作,需要下的功夫肯定會花得不少。
最後我交給了使用RASA的後端處理部分同學,他設計出斷詞,而我找到了不少關於TTS的資料,發現大部分的都是語音合成,在hugface裡也找到了關於習近平的語音合成資料,還有上網可以購買的雅婷語音包,這些都是寶貴的經驗,而我則是做出了可以切換語速,可以選用中文(台灣),英文,日文,中文(中國),中文(香港)的文字轉語音格式。

使用的成果為此,輸入文字便可以選擇使用以下語音選項,當我選擇英文,將會print出1的選擇而使用中文會print出0的顯示畫面,以此類推,日文為2,中文(中國)為3,中文(香港)為4;而我使用的語音包是由電腦中的閱讀模式裡,選擇新增語言才多出的語音包。


下一篇
Day2- 語音轉文字
系列文
鐵人挑戰28
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 則留言

0
v0937607599
iT邦新手 5 級 ‧ 2022-09-18 10:15:35

你好,你的議題很有趣呢!

我要留言

立即登入留言