Day 17: Midi與Audio的那些小事

2023 iThome 鐵人賽

DAY 17

AI & Data

工欲善其事，必先利其器。AI音樂相關應用工具介紹系列第 17 篇

15th鐵人賽 ai music midi audio

fd2

2023-10-02 23:38:23

1006 瀏覽

分享至

前面我們介紹的幾個AI作曲工具，雖然各家各有各的技術，但以最基本的層面來說，絕大部分都是在Midi檔案上面在做創作，再透過一些後續的處理來生成完整的樂曲，而接下來幾天我們則會開始介紹在AIGC概念開始成形後，比較新穎的方式: 直接透過Audio的方式生成。

所以我們先趁著今天的空檔，先來科普一下這兩種方式的差異以及分別的優缺點。

Midi生成:
Midi生成的AI音樂，在生成時是以輸出Midi格式的檔案為基底，而生成的演算法通常為

以規則為基底(Rule-Based)。
機器學習(Machine Learning/Deep Learning)模型來做訓練。

生成出來的結果也是Midi檔，音色上基本為電腦的電子音，必須透過進一步的音色庫以及編曲調整後，才能輸出成一般比較常聽到的mp3/wav等Audio格式。優點是生成出來的Midi結果可以在任何DAW上做進一步的編修或調整，因此如果生成出來的音樂沒有辦法達到100的水準，只要這些AI作曲的平台/系統有接上一個簡單的DAW，就可以讓使用者對生成的每個音符或是伴奏編曲等等做調整(如同之前介紹過的AIVA、Bandlab等等)。而缺點則是如果沒有好的音色/音源庫以及後續的編曲混響等等，則最後轉換出來的Audio音樂檔聽起來會比較單薄。

Audio生成:
目前在Audio生成的部分都是以機器學習(Machine Learning/Deep Learning)模型為主，主打的就是一個Audio to Audio的生成路線。
Audio的優點在於透國模型訓練後，生成出來的結果已經包含原本Audio資料裡面的樂器音色以及後製編曲混響等等，而缺點則是Audio音樂檔案是完全沒有辦法像Midi一樣能夠透過DAW來做細節編修的，因此Audio生成的音樂如果沒有辦法達到接近完美的成果，就等於是沒有用的輸出結果。