iT邦幫忙

2025 iThome 鐵人賽

DAY 29
0
AI & Data

認識生成式AI的結構及運作原理系列 第 29

Diffusion 模型其實是在「除噪」

  • 分享至 

  • xImage
  •  

許多人以為Diffusion模型是在「畫圖」,但從技術上來說,它真正做的事是「除噪」——一種將隨機雜訊逐步轉化為有意義影像的過程,換句話說,生成式AI並不是憑空構想畫面,而是在數學上學會「如何讓雜訊變得有意義」。

整個過程就像是相片的「顯影術」。一開始,AI先生成一張完全由亂數組成的影像——這是純噪音的畫布。接著,模型開始根據輸入提示,每一次迭代都對畫面進行細微調整,減少那些與「貓」或「鋼琴」無關的噪點。經過上百次「除噪」步驟後,最終呈現出一幅清晰的畫面。

這種除噪過程其實是一種「學習逆過程」:AI曾在訓練階段觀察成千上萬張圖片被逐漸加上雜訊的變化,於是它學會如何「反推」這個過程。當它從雜訊開始時,會一步步推回到可能的原圖狀態。

更令人驚訝的是,Diffusion模型的除噪不只是影像層面的,而是潛在空間中的數學操作,AI並不直接處理像素,而是在高維向量中除去「數據噪音」,這讓生成結果更靈活、更真實。

因此,Diffusion模型的本質不是「畫家」,而是「修復師」。它並非隨機描繪,而是在秩序與混亂之間找到平衡,用科學方式「清除雜訊」,最終讓一張不存在的畫像逐漸浮現,這也是為何我們說:AI的創造,其實是一場精密的除噪奇蹟。


上一篇
什麼是Diffusion模型?它是如何運作的?
系列文
認識生成式AI的結構及運作原理29
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言