許多人以為Diffusion模型是在「畫圖」,但從技術上來說,它真正做的事是「除噪」——一種將隨機雜訊逐步轉化為有意義影像的過程,換句話說,生成式AI並不是憑空構想畫面,而是在數學上學會「如何讓雜訊變得有意義」。
整個過程就像是相片的「顯影術」。一開始,AI先生成一張完全由亂數組成的影像——這是純噪音的畫布。接著,模型開始根據輸入提示,每一次迭代都對畫面進行細微調整,減少那些與「貓」或「鋼琴」無關的噪點。經過上百次「除噪」步驟後,最終呈現出一幅清晰的畫面。
這種除噪過程其實是一種「學習逆過程」:AI曾在訓練階段觀察成千上萬張圖片被逐漸加上雜訊的變化,於是它學會如何「反推」這個過程。當它從雜訊開始時,會一步步推回到可能的原圖狀態。
更令人驚訝的是,Diffusion模型的除噪不只是影像層面的,而是潛在空間中的數學操作,AI並不直接處理像素,而是在高維向量中除去「數據噪音」,這讓生成結果更靈活、更真實。
因此,Diffusion模型的本質不是「畫家」,而是「修復師」。它並非隨機描繪,而是在秩序與混亂之間找到平衡,用科學方式「清除雜訊」,最終讓一張不存在的畫像逐漸浮現,這也是為何我們說:AI的創造,其實是一場精密的除噪奇蹟。