iT邦幫忙

2025 iThome 鐵人賽

DAY 2
0

AI 圖像生成技術演進 (1)

今天,我們先來回顧 AI 圖像生成技術的演進,了解這些模型的核心概念與特性,為後續實作打下基礎。


一、AI 圖像生成的起點:生成對抗網絡(GAN)與變分自編碼器(VAE)

可追溯到早期的生成式模型,其中最具代表性的是

  • 生成對抗網絡(GAN, Generative Adversarial Network)
  • 變分自編碼器(VAE, Variational Autoencoder)

GAN 的核心理念是由一個 生成器 嘗試創建圖片,而另一個 判別器 判斷真假。透過不斷對抗學習,生成器能產生越來越逼真的圖像。VAE 則透過潛在空間(latent space)進行圖像編碼與重建,適合用於控制生成特徵或風格。

雖然這些模型奠定了生成式 AI 的基礎,但訓練不穩定、生成速度慢、對硬體需求高,使即時前端應用存在挑戰。


二、Diffusion 模型:生成更真實的圖像

隨著技術進步,擴散模型(Diffusion Models) 近年快速崛起,成為當前主流的圖像生成技術。Diffusion 模型的運作方式是:先逐步向圖像加入雜訊,再逐步去噪重建原始影像。

其特點包括:

  • 生成效果穩定
  • 高解析度與自然細節
  • 可依文字提示或其他條件生成圖像

上一篇
DAY1
下一篇
DAY3
系列文
融合AI圖像生成技術的前端開發實戰7
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言