在生成式 AI 的競爭中,Google 也是關鍵玩家之一。繼 PaLM(Pathways Language Model) 發布後,Google 又推出了全新的 Gemini 系列模型,展現出對多模態 AI 與跨領域應用的野心。這些模型不僅挑戰了 OpenAI 的 GPT 系列,也為產業帶來了更多元的選擇。
Google 在 2022 年推出 PaLM,其名稱代表 Pathways Language Model,是基於 Pathways 架構 所設計的大型語言模型。PaLM 的設計重點在於:
大規模參數:PaLM 擁有高達 5400 億參數,是當時最龐大的模型之一。
多語言能力:支援超過百種語言,能跨語言理解與生成。
強化推理與理解:在數學解題、邏輯推理、程式生成等方面展現不錯的表現。
PaLM 的推出讓 Google 在 LLM 領域站穩腳步,並成為 Gemini 的技術基礎之一。
在 2023 年底,Google 正式發表 Gemini,作為 PaLM 的後繼者。Gemini 不僅是一個語言模型,更是一個 多模態模型(Multimodal Model),能同時處理文字、圖片、甚至程式碼等多種資料型態。其主要特點包括:
更強的多模態能力:能理解並生成圖文內容,支援跨媒介應用。
程式設計輔助:針對程式碼生成與除錯進一步優化。
更高的效率:透過改進的架構與訓練方式,降低運算成本。
整合 Google 生態系:廣泛應用於 Google Search、Workspace、Android 等服務中。
教育:輔助學習,提供跨語言與多媒體的教學內容。
商業:結合 Google Cloud,幫助企業進行數據分析與客服自動化。
程式設計:提供開發者更精準的程式碼建議與最佳化方案。
從 PaLM 到 Gemini,Google 展現了其在 AI 發展上的持續投入。PaLM 奠定了大規模語言模型的基礎,而 Gemini 則透過多模態能力與更廣泛的應用,進一步推動了 AI 在產業中的落地。隨著 Google 與 OpenAI 的競爭加劇,未來 AI 生態系將會更加多元而精彩。