前面我們介紹的幾個AI作曲工具,雖然各家各有各的技術,但以最基本的層面來說,絕大部分都是在Midi檔案上面在做創作,再透過一些後續的處理來生成完整的樂曲,而接下來幾天我們則會開始介紹在AIGC概念開始成形後,比較新穎的方式: 直接透過Audio的方式生成。
所以我們先趁著今天的空檔,先來科普一下這兩種方式的差異以及分別的優缺點。
Midi生成:
Midi生成的AI音樂,在生成時是以輸出Midi格式的檔案為基底,而生成的演算法通常為
生成出來的結果也是Midi檔,音色上基本為電腦的電子音,必須透過進一步的音色庫以及編曲調整後,才能輸出成一般比較常聽到的mp3/wav等Audio格式。優點是生成出來的Midi結果可以在任何DAW上做進一步的編修或調整,因此如果生成出來的音樂沒有辦法達到100的水準,只要這些AI作曲的平台/系統有接上一個簡單的DAW,就可以讓使用者對生成的每個音符或是伴奏編曲等等做調整(如同之前介紹過的AIVA、Bandlab等等)。而缺點則是如果沒有好的音色/音源庫以及後續的編曲混響等等,則最後轉換出來的Audio音樂檔聽起來會比較單薄。
Audio生成:
目前在Audio生成的部分都是以機器學習(Machine Learning/Deep Learning)模型為主,主打的就是一個Audio to Audio的生成路線。
Audio的優點在於透國模型訓練後,生成出來的結果已經包含原本Audio資料裡面的樂器音色以及後製編曲混響等等,而缺點則是Audio音樂檔案是完全沒有辦法像Midi一樣能夠透過DAW來做細節編修的,因此Audio生成的音樂如果沒有辦法達到接近完美的成果,就等於是沒有用的輸出結果。
那麼明天開始,我們來介紹用Audio直接生成Audio AI音樂的幾家公司,大家可以比較看看跟前面16天介紹的公司生成出來的音樂結果差異如何。