iT邦幫忙

2024 iThome 鐵人賽

DAY 3
0
生成式 AI

從零開始學-生成式AI系列 第 3

Day3—生成式AI的概念以及歷史

  • 分享至 

  • xImage
  •  

生成式AI是一類能夠生成新內容(如文字、圖像、音頻等)的人工智慧模型。它能夠辨別傳統數據,還能創造新數據,這與傳統的判別模型(如分類模型)有很大區別。
常見的生成式模型:
簡單來說
GPT(生成預訓練變換器):可以生成自然語言文本,用於對話、故事創作等。
在現代是不可或缺的,能在很短的時間內,處理大量的文字內容,也可以產出有基本運行功能的程式碼,就像某些人說的一樣,現在正在進入no code的時代。其速度及可運作的規模之大,我可能需要好幾個小時來研究、撰寫,它可能幾秒就能完成。

GPT 如何運作?
雖然將 GPT 模型描述為人工智慧 (AI) 是準確的,但這是一個廣泛的描述。更具體來說,GPT 模型是在轉換程式架構上建置的神經網路型語言預測模型。這些模型可分析自然語言查詢 (稱為提示),並根據對語言的理解預測最佳回應。
為此,GPT 模型依賴於在大量語言資料集上,使用數千億個參數進行訓練後獲得的知識。他們可以考慮輸入內容並動態處理輸入的不同部分,使其能夠產生較常的回應,而不僅僅是序列中的下一個單詞。例如,要求產生一段莎士比亞風格的內容時,GPT 模型會記住並重新建構具有類似文學風格的新片語和整個句子,藉此來實現這一目標。
有不同類型的神經網路,如遞歸和卷積。GPT 模型是轉換程式神經網路。轉換程式神經網路架構使用自我專注機制,在每個處理步驟中專注於輸入文字的不同部分。轉換程式模型會擷取更多內容,並改善自然語言處理 (NLP) 任務的效能。(從網站理解

GAN(生成對抗網絡):擅長生成逼真的圖像、影片等。
在網站的範例中能看到它對圖像的分解、補全、創作的能力,它有多種類型去匹配要使用的領域,

生成式對抗網路 (GAN) 是一種深度學習架構。它訓練兩個神經網路來彼此競爭,從指定的訓練資料集中產生更真實的新資料。例如,您可以從現有的影像資料庫中產生新影像,或從歌曲資料庫中產生原始音樂。GAN 之所以被認為具有對抗性,是因為它可以訓練兩個不同的網路並使它們相互對抗。一個網路採取輸入資料範例,並儘可能多地修改來產生新資料。另一個網路會嘗試預測產生的資料輸出是否屬於原始資料集。換言之,預測網路確定產生的資料是虛假還是真實。系統會產生較新的改進版假資料值,直至預測網路無法再區分虛假資料與原始資料。
生成式對抗網路如何運作?
生成式對抗網路系統包括兩個深度神經網路 — 產生器網路和鑑別器網路。
這兩個網路在對抗性遊戲中訓練模型,其中一個網路嘗試產生新資料,另一個網路嘗試預測輸出是虛假資料還是真實資料。
從技術上講,GAN 的運作方式如下。複雜的數學方程式構成整個運算程序的基礎,以下是其簡單的概述:
產生器神經網絡神經網路分析訓練集並識別資料屬性
鑑別器神經網路分析初始訓練資料並獨立區分屬性
產生器透過向某些屬性新增雜訊 (或隨機變化) 來修改某些資料屬性
產生器將修改的資料傳遞給鑑別器
鑑別器計算產生輸出屬於原始資料集的概率
鑑別器為產生器提供一些指導,以減少下一個週期中雜訊向量隨機化
產生器嘗試最大限度提高鑑別器發生錯誤的概率,而鑑別器嘗試將錯誤的可能性降到最低。
在訓練反覆運算中,產生器和鑑別器會不斷演變並相互對抗,直到它們達到平衡狀態。在平衡狀態下,鑑別器無法再辨識合成資料。至此,培訓程序結束。圖(網站

生成式AI(Generative AI)的歷史可以追溯到人工智能的早期發展,但其真正的發展是在近年來深度學習技術進步的基礎上實現的。以下是生成式AI歷史的一些重要里程碑:

1. 早期生成技術與AI基礎

  • 1950-60年代:在這一時期,計算機科學家開始研究如何讓計算機模仿人類的創造力。艾倫·圖靈提出的圖靈測試也為未來的AI研究奠定了理論基礎。
  • 1970年代:早期的生成技術包括一些簡單的規則系統和隨機生成方法,比如用來創造詩歌或音樂的算法,但這些方法非常有限。

2. 生成模型的引入

  • 1980年代:研究人員開始探索如何通過機器學習來生成內容。反向傳播算法(Backpropagation)的發現推動了神經網絡的發展,雖然當時的技術受限,但為日後的突破打下了基礎。

3. 深度學習時代的到來

  • 2010年代初:隨著計算能力的提高,特別是GPU(圖形處理單元)的進步,深度學習模型得以蓬勃發展。這時期,卷積神經網絡(CNN)和遞歸神經網絡(RNN)得到了廣泛應用,特別是在圖像生成和語言處理領域。

4. 生成對抗網絡(GANs)的誕生

  • 2014年:伊恩·古德費羅(Ian Goodfellow)和他的同事提出了生成對抗網絡(GANs)的概念,這是一種使用兩個神經網絡相互競爭的模型,一個生成數據,另一個則試圖區分真假數據。GANs在生成圖像和視頻等方面取得了驚人的效果,成為生成式AI的重大突破。

5. 自回歸模型與自然語言生成

  • 2018年:OpenAI推出了GPT(Generative Pre-trained Transformer)模型,它是一種基於Transformer架構的自回歸模型,專注於自然語言的生成和理解。GPT系列模型的發展,特別是GPT-3,在生成文本的流暢度和上下文理解上達到了前所未有的高度,使得生成式AI在文字創作、對話生成等方面得到了大規模應用。

6. 擴散模型與強化學習的應用

  • 2020年代:在圖像生成方面,除了GANs,擴散模型(Diffusion Models)等新技術也開始興起。這些模型能夠以更加穩定的方式生成高質量的圖像。此外,生成式AI還融合了強化學習技術,進一步提高了AI生成的質量與效率。

7. 跨模態生成

  • 2020年代初期:生成式AI開始應用於多模態數據的生成,這意味著AI能夠同時生成文字、圖像、音頻、甚至3D模型。OpenAI的DALL·E和CLIP等模型展示了將語言轉化為圖像的能力,進一步擴大了生成式AI的應用範圍。

8. 現今與未來發展

  • 如今,生成式AI已經深入應用到各個行業,包括藝術創作、遊戲開發、電影製作、醫療、金融等領域。隨著技術的進一步發展,生成式AI將在更多領域中發揮更大的作用。

由大型語言生成的內容,能在短時間學到很多知識,在查證過後,正確率很高,也因此是很好的學習工具
,今天學習到此為止,預計明天的內容是

機器學習的基礎

參考網站1
參考網站2


上一篇
Day2---行程規劃以及進度表
下一篇
Day5---使用 Hugging Face 進行文本生成
系列文
從零開始學-生成式AI6
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言