【Day 3】LLM 的演變：從 GPT-3 到最新模型的進展 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2024 iThome 鐵人賽

DAY 3

0

生成式 AI

重塑未來：LLM 如何引領區塊鏈與賽局理論的創新應用系列第 3 篇

【Day 3】LLM 的演變：從 GPT-3 到最新模型的進展

16th鐵人賽 llm gpt

2024-09-17 22:52:26

508 瀏覽

分享至

LLM 和 Transformer

前面我們已經聊到 LLM 的快速發展，以及它不可忽視的能力。講個笑話，曾經有個程式設計師上班時無法工作，老闆問為什麼? 他回答:因為現在 ChatGPT 當機了。這雖然聽起來是虛構的，但已經體現出 ChatGPT 大大的影響我們的工作型態。

而 Transformer，是 ChatGPT 得以取得巨大成功的一個關鍵技術。Transformer 是一個深度學習架構，由 Google 所提出 [1]。相對於先前的深度學習技術，例如 RNN 或 CNN，它主要的作法使用注意力機制 (Attention)，精確來說是使用自注意力(Self-attention)來提高重點關注對象的權重，並且降低非關注對象的權重，以便產生正確的生成結果。

自注意力(Self-attention)的作法是，會考慮每個元素(例如文字)與整個輸入序列(Input Sequence)的關聯性來計算這個元素的權重。這樣做的好處是讓深度學習模型可以擺脫對輸入順序的高度依賴，以便根據上下文的資訊來處理輸入序列。這讓模型能夠同時考慮輸入序列所有元素彼此之間的關係，從而能夠達到更好的學習效果與速度。

從 GPT-3 到 GPT-4: 見證 AI 奇點的出現

從 GPT-3 於 2022 年推出以來，目前最新的進展已經到了 GPT-4o。如果你用過 GPT-3，你會認為 AI 的能力還差得遠，但是隨著新版本的 GPT 不斷推出，所展現出來的能力已經越來越讓人驚豔。例如我現在做簡報時，就常常使用 GPT-4o 來幫我畫四格漫畫，解釋複雜的概念。

而在我求學的年代，當我們學習 AI 時，講台上的老師還在感嘆不知道何年何月，才能看到生成式 AI 的出現。沒想到 GPT 就這麼的橫空出世，這也就是我們稱 2022 年是 AI 奇點年的原因。

接下來呢? 未來的發展趨勢

LLM 未來的發展趨勢主要為: 1.提高生成式內容的正確性，2.增加模型的個人化，以及 3.應用於專業領域的 AI。

而不只是 ChatGPT，目前有更多生成式 AI 工具可以使用，例如:Gemini、Claude、Perplexity AI 等。還有更多針對特定功能推出的 AI 協作工具。預期未來，會有更多更好用的 AI 工具問世。

結論

今天我們簡要回顧了 LLM 的核心技術: Transformer，並且討論了 GPT-3 到 GPT-4，以及其他目前主流的生成式 AI 工具。

處在 AI 時代，學習生成式 AI 工具，已經像以前需要學習文書處理工具一樣重要了。預期在未來求職網站上，會出現要求具備生成式 AI 工具使用技能的職位描述。讓我們一起擁抱 AI 吧!

在下一篇中，我們將開始探討 LLM 如何重塑區塊鏈技術，明天見囉!

參考資料:

Vaswani, A. (2017). Attention is all you need. Advances in Neural Information Processing Systems.

【Day 2】LLM 解密 - 大語言模型如何改變我們的世界

【Day 4】LLM 如何重塑區塊鏈技術：兩個應用範例

系列文

重塑未來：LLM 如何引領區塊鏈與賽局理論的創新應用共 30 篇

目錄

RSS系列文訂閱系列文

7 人訂閱

完整目錄

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22211 篇

完賽人數

600 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js