目前正在做的事情是嘗試把一個人的聲音轉換成另一個人的聲音,現在做到使用 AUTO-VC 轉換,未來正在實驗自己的 Model ( 目前用的是 Tramsformer ) 這個過程遇到了不少問題,因此想要紀錄一下,也跟大家分享。
為什麼 Transformer ? 回顧 LSTM 與 CNN ,在一開始處理 time-sequence 這類問題的時候,我們都知道要用 RNN 這類的模型...
Query,Key,Value 在昨天我們有提到 "自" 注意力機制,現在我們更詳細的來看具體是怎麼算的。 先定義一下 "做 a...
Positional Encoding 怎麼做的 書接昨日,我們說 Positional Encoding 是人工設計的,那它在原本的論文裡面是怎麼設計的呢?...
開始施工 本來是想分享自己參考網路作法再改寫出來的 Transformer,但後來發現自己的架構並不是原本的 Transformer encoder (也沒加...
開始施工 今天我們要來製作 Transformer Decoder 的部分,一樣先上個圖方便施工 以下都跟 Hung-yi Lee 老師及 Tensor...
前言 音樂家的藝術不在於直接描繪形象,而在於把心靈置於這些物件能夠在心靈裡創造的情緒中去。—— 盧梭 也許你不是一個感性的人,看著身旁的朋友因為電影的情節...
簡述音樂情緒模型 看完了昨天的介紹之後,我們知道音樂跟情緒是有相關且可以被分類的,而把這其中關係模型化的方式也是有很多種,但具體來說主要分成兩大流派 類別...
Youtube-downloader 不管是在做聲音研究或是音樂研究的時候,雖然已經有很多資料集可以用了,但如果還是想製造一些特定風格的音樂資料集,或是想自定...
超強的 AI 作曲 在 2020 年的時候 NVIDIA 在 YT 上發表了這支影片,裏頭使用到的音樂的音樂,據他們所宣稱,完全是由 AI 進行編曲的與和弦的...
大家好,如果你是從第一天就開始看的人,我是真心非常感謝您的陪伴,陪我走過了這瘋狂的 30 天,想當初只是我實驗室同學慫恿我報名,而且還是在開賽前一天講的,最後...