生成式AI簡單來說就是一種可以從眾多數據中學習並創造新數據的技術。不同於以往傳統的分類或預測模型,生成式模型不僅僅能夠從已有數據中學習,更能生成與這些數據類似的全新數據。
生成式模型的類型主要有生成對抗網絡(GAN)、變分自動編碼器(VAE)及生成式語言模型(如ChatGPT),而其中生成對抗網絡是通過生成器和鑑別器兩個模型之間的對抗來生成新的數據;變分自動編碼器則是通過將數據壓縮到潛在空間,再從中生成新的數據。而我現在最常使用的就是生成式語言模型,它主要是用於自然語言生成的AI模型,能根據我們的文字輸入去生成自然語言文本。
而生成式AI的工作原理有分為輸入、學習以及生成,輸入的部份是我們給模型提供大量的練習數據,這些數據可以是圖像、文本等等,再來模型就會學習這些數據的特徵以及分布,最後生成與訓練數據相似的新樣本。而生成式模型基於機率學習數據的分佈,所以能生成具有相同分佈的新數據。
我今天相關的學習差不多就到這邊,感謝大家~