大語言模型(LLM)

2025 iThome 鐵人賽

DAY 4

AI & Data

認識生成式AI的結構及運作原理系列第 4 篇

17th鐵人賽

akizuki

2025-09-18 14:51:34

486 瀏覽

分享至

講了基本的生成概念後，我們來看一個對生成式ai很重要的東西: 大語言模型

什麼是大語言模型(Large Language Model, LLM)？

大語言模型是一種基於人工智慧(AI)和深度學習技術所建立的模型，主要用來處理與人類語言相關的任務，如文字生成(寫文章、回覆訊息)、語言翻譯、文章摘要、問答系統及程式碼生成等。

為什麼叫「大」語言模型？

「大」有兩層意思：

1.龐大的參數量：
模型是由神經網路組成，內部包含數百億甚至上兆個參數，能捕捉語言中的細微規律。

2.大量的訓練資料：
透過龐大的語料庫(如網頁文章、書籍、新聞、對話等)訓練，使模型能理解並模仿人類語言的使用方式。

大語言模型是如何運作的？

1.學習語言規律：
在訓練時，模型會嘗試「預測下一個字」或「預測句子的後續內容」。
例如輸入：「今天的天氣晴，所以我想去.....」，模型可能預測「散步」「公園」「旅行」。

2.統計與語境結合：
它不是死背語料，而是透過大量數據，捕捉語言結構與語意的關聯。

3.推理與生成：
當你輸入問題或指令，模型會利用已學到的語言規律，生成合理、連貫的回應。

特色與應用

透過大語言模型，ai更能生成自然、接近人類的文字，具備一定的推理與知識表達能力，目前應用於智慧客服、自動寫作與輔助寫作、語言學習輔助、搜尋引擎強化及程式設計輔助等。

生程式ai生成過程2

Prompt說明(1)

系列文

認識生成式AI的結構及運作原理共 30 篇

RSS系列文訂閱系列文

0 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

認識生成式AI的結構及運作原理系列 第 4 篇