iT邦幫忙

2025 iThome 鐵人賽

DAY 9
0
AI & Data

認識生成式AI的結構及運作原理系列 第 9

Gemma以及LLaMA - LLaMA篇

  • 分享至 

  • xImage
  •  

今天來說明另一個模型:LLaMA
LLaMA 是什麼?
LLaMA(Large Language Model Meta AI)是Meta(Facebook的母公司)在2023年推出的一系列大型語言模型(LLM)。

發展歷程
1.LLaMA 1(2023):第一版,規模從7B到65B參數,開源後迅速成為社群熱門基礎模型。
2.LLaMA 2(2023/7):性能提升,Meta與Microsoft合作,在Azure上提供服務,並允許商用。
3.LLaMA 3(2024/4):進一步增強推理、程式碼能力與多語言能力,目前被廣泛用作各種開源AI專案的底層模型。

模型特色
1.開放下載:只要申請並同意條款,研究人員和企業都能獲取。
2.多種規模:7B、13B、34B、65B(參數越多,能力越強,但需要更強硬體)。
3.性能強:在推理、對話、程式碼任務上,LLaMA 2/3的表現接近甚至超越一些封閉模型。
4.商用授權:不像很多研究用模型只能學術用途,LLaMA可合法用於商業應用。
5.社群活躍:LLaMA開源後,衍生出許多變種,例如Alpaca、Vicuna、Mistral等。

應用
對話型AI、程式碼助理、翻譯與摘要、企業專屬模型。


上一篇
Gemma以及LLaMA - Gemma篇
下一篇
生成式AI與分辨式AI的比較(1)
系列文
認識生成式AI的結構及運作原理12
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言