iT邦幫忙

2025 iThome 鐵人賽

DAY 7
0
生成式 AI

AI創世紀:生成式智慧的無限想像系列 第 7

生成式 AI 在文字與圖像生成中的技術應用

  • 分享至 

  • xImage
  •  

一、文字生成(Text Generation)技術

文字生成主要來自自然語言處理(NLP)與深度學習模型的發展,核心技術包括:
1. Transformer 架構
• 透過 Self-Attention 機制,模型能有效捕捉上下文關係。
2. 大型語言模型(LLM)
• 以海量文本訓練,具備語言理解與生成能力。
• 代表:GPT 系列(OpenAI)、Claude(Anthropic)、Gemini(Google)、LLaMA(Meta)。
3. 強化學習與人類回饋(RLHF)
• 結合使用者回饋,讓模型生成更貼近人類需求的內容。
4. 少樣本學習(Few-shot/Zero-shot Learning)
• 能在極少甚至沒有範例的情況下完成任務,提升通用性。

二、圖像生成(Image Generation)技術

圖像生成依靠生成模型(Generative Models),目前以 擴散模型 為主流,技術包括:
1. 生成對抗網路(GANs, Generative Adversarial Networks)
• 生成器與判別器相互競爭,能產生擬真的影像。
• 代表:StyleGAN、BigGAN。
2. 擴散模型(Diffusion Models)
• 由雜訊逐步去噪,生成符合文字描述或指定條件的影像。
• 代表:DALL·E、Stable Diffusion、MidJourney。
3. 變分自編碼器(VAE, Variational Autoencoder)
• 將影像壓縮至潛在空間(latent space),再重建或生成新影像。
• 常與擴散模型結合使用。
4. 自注意力機制於影像模型(Vision Transformer, ViT)
• 加強模型對影像中局部與整體結構的理解。


上一篇
Transformer 的類型差異與應用
下一篇
生成式 AI 在音樂與聲音合成的技術應用
系列文
AI創世紀:生成式智慧的無限想像10
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言