哈囉大家好,今天我要來說說的東西是「擴散模型(Diffusion Models)」,擴散模型是一種近年在生成式AI領域受到廣泛關注的新型模型,特別是在圖像生成領域有著顯著的成果。
擴散模型本身是一種基於概率的方法,用於逐步生成數據。在這種模型中,數據的生成過程被建模為一個反向的擴散過程(Reverse Diffusion Process),白話一點說,就是從一個完全隨機的噪聲開始,逐步「去噪」去得到一個真實的數據樣本。這種方法與傳統的生成對抗網絡(GAN)或變分自編碼器(VAE)有本質的區別。
擴散模型的核心思想源於物理學中的擴散過程,它會將真實數據逐步添加隨機噪聲,使其最終變成純噪聲,這個過程稱為「前向擴散過程(Forward Diffusion Process)」。而最終訓練的目標是學習這個過程的反向,即從純噪聲開始,逐步去除噪聲,以恢復出原始的數據。
再來是他生成的步驟,這種生成過程可以分為多個步驟,每個步驟都嘗試去除一部分噪聲,從而生成逼真的數據樣本。擴散模型相較於傳統的GAN具有更好的穩定性,因為它不涉及對抗性的訓練過程,不容易出現模式崩潰(Mode Collapse)等問題。
這是我今天的內容喔,感謝大家~