前面介紹的AI Audio Generators,基本上都著重在純音樂(BGM)的生成,
而今天所要介紹的Suno.ai則是把人聲也加入AI生成模型裡。
Suno早期做的是語音合成的服務,他們推出了一個線上的語音模型Bark,
Bark可以提供文字轉換成語音的效果,而且只需透過簡單的文字指令,便能讓AI在說話過程中展現出各種猶如真人般的說話情感,例如笑聲、猶豫、悲傷或是嘆息等等,甚至還能在說話之前先清清喉嚨。而Bark目前公布支援的語言高達13種,包含中文、英文、日文、韓文等等等,此外Bark還能在同個講話段落中穿插多國語言,輕鬆達成晶晶體的效果。
說回Suno吧,Suno.ai目前提供的服務只提供在Discord上,在加入他們的Discord頻道後,可以看到大家在上面使用Suno所生成的音樂,只要點選左邊的Chirp的任何一個頻道後,就可以開始使用它們的歌詞作曲功能。
使用的方式也很簡單,只要在對話框輸入/chirp並送出,即可啟動Suno.ai的作曲功能
根據提示的內容,可以分別輸入
接下來只要點擊提交後等待Suno通知創作完成即可。
Suno會根據你的輸入一次幫你生成兩首音樂,點擊播放即可聆聽,而Suno也提供了簡單的後續控制:
與前面介紹的Audio AI Generators相比,Suno.ai最特別的就是他不但能夠生成音樂且
還能夠直接把歌詞給唱出來,這部分也許能歸功於Bark裡頭足夠的語音訓練資料,
Suno.ai的歌聲演唱並不會聽起來有很明顯的機器人突兀的聽感,這點可以跟之前介紹過的虛擬合成人聲做比較,
以目前的技術來說,先生成音樂後再加入虛擬合成人聲的效果絕大多數聽起來都會有一種機器人的不自然感,
而Suno.ai由於訓練的資料本來就是帶有歌唱聲的Audio音檔,因此人聲以及演唱的聲調都已經包含在訓練的過程裡面,也因此能夠唱出相對自然的歌聲。
目前Suno.ai還是處於在Discord上Beta的階段,但不久前Suno.ai已經公布了未來的收費方向: