iT邦幫忙

2025 iThome 鐵人賽

DAY 4
0
AI & Data

認識生成式AI的結構及運作原理系列 第 4

大語言模型(LLM)

  • 分享至 

  • xImage
  •  

講了基本的生成概念後,我們來看一個對生成式ai很重要的東西: 大語言模型

什麼是大語言模型(Large Language Model, LLM)?

大語言模型是一種基於人工智慧(AI)和深度學習技術所建立的模型,主要用來處理與人類語言相關的任務,如文字生成(寫文章、回覆訊息)、語言翻譯、文章摘要、問答系統及程式碼生成等。

為什麼叫「大」語言模型?

「大」有兩層意思:

1.龐大的參數量:
模型是由神經網路組成,內部包含數百億甚至上兆個參數,能捕捉語言中的細微規律。

2.大量的訓練資料:
透過龐大的語料庫(如網頁文章、書籍、新聞、對話等)訓練,使模型能理解並模仿人類語言的使用方式。

大語言模型是如何運作的?

1.學習語言規律:
在訓練時,模型會嘗試「預測下一個字」或「預測句子的後續內容」。
例如輸入:「今天的天氣晴,所以我想去.....」,模型可能預測「散步」「公園」「旅行」。

2.統計與語境結合:
它不是死背語料,而是透過大量數據,捕捉語言結構與語意的關聯。

3.推理與生成:
當你輸入問題或指令,模型會利用已學到的語言規律,生成合理、連貫的回應。

特色與應用

透過大語言模型,ai更能生成自然、接近人類的文字,具備一定的推理與知識表達能力,目前應用於智慧客服、自動寫作與輔助寫作、語言學習輔助、搜尋引擎強化及程式設計輔助等。


上一篇
生程式ai生成過程2
下一篇
Prompt說明(1)
系列文
認識生成式AI的結構及運作原理5
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言