Diffusion 模型其實是在「除噪」

2025 iThome 鐵人賽

DAY 29

AI & Data

17th鐵人賽

219 瀏覽

許多人以為Diffusion模型是在「畫圖」，但從技術上來說，它真正做的事是「除噪」——一種將隨機雜訊逐步轉化為有意義影像的過程，換句話說，生成式AI並不是憑空構想畫面，而是在數學上學會「如何讓雜訊變得有意義」。

整個過程就像是相片的「顯影術」。一開始，AI先生成一張完全由亂數組成的影像——這是純噪音的畫布。接著，模型開始根據輸入提示，每一次迭代都對畫面進行細微調整，減少那些與「貓」或「鋼琴」無關的噪點。經過上百次「除噪」步驟後，最終呈現出一幅清晰的畫面。

這種除噪過程其實是一種「學習逆過程」：AI曾在訓練階段觀察成千上萬張圖片被逐漸加上雜訊的變化，於是它學會如何「反推」這個過程。當它從雜訊開始時，會一步步推回到可能的原圖狀態。

更令人驚訝的是，Diffusion模型的除噪不只是影像層面的，而是潛在空間中的數學操作，AI並不直接處理像素，而是在高維向量中除去「數據噪音」，這讓生成結果更靈活、更真實。

因此，Diffusion模型的本質不是「畫家」，而是「修復師」。它並非隨機描繪，而是在秩序與混亂之間找到平衡，用科學方式「清除雜訊」，最終讓一張不存在的畫像逐漸浮現，這也是為何我們說：AI的創造，其實是一場精密的除噪奇蹟。

系列文

認識生成式AI的結構及運作原理共 30 篇

0 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

IT邦幫忙