從2024年初發表Gemma 到現在1年多,已經到Gemma 3 了,我們來看看Gemma 家族有什麼模型吧!
作為家族的開創者,第一代 Gemma 提供了兩種尺寸,迅速在開發者社群中普及:
Gemma 2B:輕巧高效,適合在筆記型電腦或資源有限的環境中運行,主要用於研究和實驗。
Gemma 7B:在保持相對較小規模的同時,提供了與當時其他大型模型相媲美的卓越效能,特別是在英文、程式碼與數學推理方面。
Gemma 2 在第一代的基礎上進行了顯著升級,提供了更高的效能和更佳的推理效率,並引入了新的模型尺寸:
Gemma 2B:進一步優化,效能超越前代。
Gemma 9B:全新的中量級尺寸,在效能與資源需求之間取得絕佳平衡。
Gemma 27B:為需要頂尖效能的任務而生,在同尺寸級別的模型中具備領先的表現。
Gemma 3 是家族的最新成員,帶來了多模態輸入和更廣泛的多語言支援,並進一步擴展了模型尺寸,使其應用範圍更為廣泛:
多樣化的尺寸:提供從 1B、4B、12B 到 27B 的多種尺寸,滿足從行動裝置到雲端伺服器的不同部署需求。
Gemma 3n:專為行動裝置優化的版本,在低延遲的音訊和視覺理解方面表現出色。
Gemma 270m : 用於特定任務的微調,並已訓練有素,具有強大的指令跟踪和文本結構化能力。
這是一個專為程式碼相關任務設計的模型系列,支援多種主流程式語言,如 Python, Java, C++, JavaScript 等。
PaliGemma 是一款多模態模型,結合了視覺模型 (SigLIP) 和大型語言模型 (Gemma),使其能夠理解圖像和文字的關聯。
模型家族 | 主要尺寸 | 核心特色 | 主要應用場景
Gemma 1 | 2B, 7B | 開放式、僅解碼器架構 | 通用文字生成、研究實驗
Gemma 2 | 2B, 9B, 27B | 混合注意力、更長上下文、高效能 | 複雜的長文本處理、企業級應用
Gemma 3 | 1B, 4B, 12B, 27B | 多模態輸入、超長上下文 (128K)、多語言 | 視覺問答、多語言應用、行動裝置部署
CodeGemma | 2B, 7B | 專為程式碼優化 | 程式碼開發輔助、自動化程式設計
PaliGemma | 3B | 視覺與語言結合 | 圖像理解、多模態資料分析
##大家可以不同的特性來選用 Gemma 模型