如果要實作練習,就要尋找開源模型,gemma或著LLaMA都是很好的選擇,但對於設備較差的我來說Gemma這種輕量型模型比較好進行實作的部分,因此今天先來介紹之後會用到的Gemma。
Gemma是什麼?
Gemma是Google DeepMind和Google研究團隊在2024年推出的開源大型語言模型,以下是其特色:
1.開源:Gemma可供研究人員免費下載、在本地或雲端運行。
2.輕量化:設計給單張GPU或一般開發環境也能跑得動。
3.指令微調版本:除了基礎模型,Google也釋出經過「指令調整」的版本,適合對話、問答、摘要等應用。
4.安全與責任:內建了Google的安全過濾與評估方法,避免模型濫用。
5.靈活部署:可以用在Kaggle、Colab Notebook,或在Google Cloud的Vertex AI上一鍵部署。
各代版本
Gemma目前已經發展到Gemma 3,歷代版本有:
1.Gemma 2B:小型,適合個人電腦或筆電運行。
2.Gemma 7B:中型,需要較強的GPU,但仍能在單機或雲端環境運行。
3.Gemma 3:新增了多模態能力(可接受文字+圖像輸入)、支援更長的上下文、多語言能力更強。
應用範圍
文本生成、寫作輔助、創作、問答系統、客服、自動回覆、摘要、快速整理文章重點及程式碼生成與分析。