大型語言模型(Large Language Models, LLMs)憑藉著龐大的參數規模和訓練資料,有著卓越的語言理解與生成能力。然而,並非所有場景都需要這樣的「 大型 」語言模型。隨著 AI 模型走入更多實際應用場域,包括手機、邊緣裝置,成本、延遲與隱私等問題也逐漸浮上檯面。在這樣的背景下,SLM(Small Language Model,小型語言模型)受到關注。這類模型雖然規模較小,但在效能與成本控制上展現出驚人的潛力,甚至在某些任務中足以與大型模型一較高下。
應用情境 | 適合選擇 | 原因 |
---|---|---|
即時回應、邊緣計算 | SLM | 延遲低、可本地運作 |
專業領域(如醫療、法律、金融) | SLM | 可控、隱私 |
跨領域輔助、資料查詢 | LLM | 通用性、知識覆蓋廣 |
創意生成、摘要寫作、小說 | LLM | 處理語境、生成多樣性 |
預算有限、中小型團隊 | SLM | 控制成本、快速部署 |