Gemma以及LLaMA - Gemma篇 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2025 iThome 鐵人賽

DAY 8

AI & Data

認識生成式AI的結構及運作原理系列第 8 篇

Gemma以及LLaMA - Gemma篇

17th鐵人賽

akizuki

2025-09-22 16:31:45

396 瀏覽

分享至

如果要實作練習，就要尋找開源模型，gemma或著LLaMA都是很好的選擇，但對於設備較差的我來說Gemma這種輕量型模型比較好進行實作的部分，因此今天先來介紹之後會用到的Gemma。

Gemma是什麼？
Gemma是Google DeepMind和Google研究團隊在2024年推出的開源大型語言模型，以下是其特色:
1.開源:Gemma可供研究人員免費下載、在本地或雲端運行。
2.輕量化:設計給單張GPU或一般開發環境也能跑得動。
3.指令微調版本:除了基礎模型，Google也釋出經過「指令調整」的版本，適合對話、問答、摘要等應用。
4.安全與責任:內建了Google的安全過濾與評估方法，避免模型濫用。
5.靈活部署:可以用在Kaggle、Colab Notebook，或在Google Cloud的Vertex AI上一鍵部署。

各代版本
Gemma目前已經發展到Gemma 3，歷代版本有：
1.Gemma 2B：小型，適合個人電腦或筆電運行。
2.Gemma 7B：中型，需要較強的GPU，但仍能在單機或雲端環境運行。
3.Gemma 3：新增了多模態能力(可接受文字+圖像輸入)、支援更長的上下文、多語言能力更強。

應用範圍
文本生成、寫作輔助、創作、問答系統、客服、自動回覆、摘要、快速整理文章重點及程式碼生成與分析。