iT邦幫忙

2025 iThome 鐵人賽

DAY 28
0
AI & Data

認識生成式AI的結構及運作原理系列 第 28

什麼是Diffusion模型?它是如何運作的?

  • 分享至 

  • xImage
  •  

Diffusion模型是現代生成式AI中最令人驚豔的技術之一。它被廣泛應用於影像生成,例如 Stable Diffusion、Midjourney、DALL·E等,簡單來說,Diffusion模型的運作原理是讓AI學會「從雜訊中創造秩序」——就像從一張被噪點覆蓋的照片中,一步步還原出清晰的影像。

它的訓練分成兩個階段:正向擴散與反向擴散

在正向階段,模型會把一張原始圖片逐步加入隨機雜訊,直到變成完全看不出內容的「純噪點」,這個過程讓AI學會影像在不同噪音程度下的變化模式,接著,在反向階段,模型嘗試從這張被破壞的圖片中,一步步「去除噪音」,還原出原圖,這樣反覆訓練後,AI就學會如何從一團雜訊中生成新的圖像。

Diffusion模型的核心是一種「機率建模」:它在每一步都根據學到的統計關係,預測哪種像素最可能出現在當前畫面的狀態中,每一次「去噪」的微調,就像畫家逐層上色,最終組合成逼真的影像。

與過去的生成對抗網路相比,Diffusion模型穩定性更高、細節更自然,也能控制生成過程,例如只要輸入「貓坐在宇宙裡」,模型就會從雜訊中逐步顯影出「太空貓」的畫面。

簡而言之,Diffusion模型的魔法不在於「創造」,而在於「還原」——它用數學學會如何從混亂中恢復秩序,讓電腦真正具備了「想像」的能力。


上一篇
生成式AI並不是完美隨機的
系列文
認識生成式AI的結構及運作原理28
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言