生成式人工智慧(Generative AI)生成圖片的核心技術之一是深度生成模型,例如擴散模型(Diffusion Model)或生成對抗網路(GAN)。這些模型的運作方式大致分為三個步驟:
學習階段:AI先接收大量圖片資料,例如貓、風景或油畫,並學習其中的特徵(形狀、顏色、風格)。
隨機噪聲開始:在生成過程中,AI 從一張「隨機雜訊」影像出發,就像一張全是灰點的照片。
逐步生成:模型根據使用者輸入的提示詞(prompt),一步步將雜訊「還原」成符合描述的圖片。這個過程就像數位藝術家在空白畫布上逐層上色,直到完成作品。
例如,當我們輸入提示:「一隻坐在書桌前的貓,戴著眼鏡讀書,卡通風格」,AI 便會根據學到的資料,把隨機雜訊轉換成對應的圖像。
AI生成的圖片: