Gemma以及LLaMA - LLaMA篇 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2025 iThome 鐵人賽

DAY 9

AI & Data

認識生成式AI的結構及運作原理系列第 9 篇

Gemma以及LLaMA - LLaMA篇

17th鐵人賽

akizuki

2025-09-23 13:56:54

492 瀏覽

分享至

今天來說明另一個模型:LLaMA
LLaMA 是什麼？
LLaMA(Large Language Model Meta AI)是Meta(Facebook的母公司)在2023年推出的一系列大型語言模型(LLM)。

發展歷程
1.LLaMA 1(2023):第一版，規模從7B到65B參數，開源後迅速成為社群熱門基礎模型。
2.LLaMA 2(2023/7):性能提升，Meta與Microsoft合作，在Azure上提供服務，並允許商用。
3.LLaMA 3(2024/4):進一步增強推理、程式碼能力與多語言能力，目前被廣泛用作各種開源AI專案的底層模型。

模型特色
1.開放下載:只要申請並同意條款，研究人員和企業都能獲取。
2.多種規模:7B、13B、34B、65B(參數越多，能力越強，但需要更強硬體)。
3.性能強:在推理、對話、程式碼任務上，LLaMA 2/3的表現接近甚至超越一些封閉模型。
4.商用授權:不像很多研究用模型只能學術用途，LLaMA可合法用於商業應用。
5.社群活躍:LLaMA開源後，衍生出許多變種，例如Alpaca、Vicuna、Mistral等。

應用
對話型AI、程式碼助理、翻譯與摘要、企業專屬模型。