▋前言
在系統中,我們不只要做逐字稿與情緒分析,還希望能生成「教學摘要」與「學習建議」。這就需要引入大型語言模型 (LLM)。
▋內容
比賽有一個限制:不得使用雲端 API。這意味著像 GPT-4、Claude 這些雲端模型都不能使用。我們必須尋找地端可運行的開源模型。
我們比較過幾種 LLM:
LLaMA (Meta)
優點:開源,社群活躍,資源多。
缺點:推理速度比 GPT-4 慢,需要 GPU 支援。
Falcon
優點:開源許可友善,能在中小型硬體環境下跑。
缺點:英文表現佳,但在中英文混合任務上稍弱。
Mistral
優點:小型化設計,能效比佳。
缺點:模型成熟度與生態系仍在發展中。
最終我們選擇 Ollama + LLaMA 模型,原因是:
能完全離線運行,符合資料保護規範。
能夠整合逐字稿與情緒數據,生成教學摘要。
推理品質在教育場景中已足夠實用。
請ChatGPT幫我們整理一個易讀的比較表:
模型 | 開發單位 | 開源/授權 | 模型大小 | 優點 | 缺點 | 適用場景 |
---|---|---|---|---|---|---|
LLaMA 2 | Meta AI | 開源(需申請) | 7B / 13B / 70B | 社群活躍,資源豐富,多語言能力佳 | 推理速度慢,需高效能 GPU | 通用 NLP 任務,教育研究,地端應用 |
Falcon | TII UAE | 開源 (Apache 2.0) | 7B / 40B | 授權友善,英文任務表現好,效能高 | 中英文混合表現一般 | 英文會議摘要,客戶服務,研究應用 |
Mistral | Mistral AI | 開源 (Apache 2.0) | 7B | 高效能小模型,適合中小型 GPU | 生態系仍在發展,工具鏈不如 LLaMA 完整 | 輕量級應用,教育場合,低資源環境 |
GPT-4 | OpenAI | 專有 | 未公開 | 最強通用性,跨語言支援廣泛 | 需雲端 API,無法完全離線 | 商業應用,雲端聊天機器人 |
Claude 3 | Anthropic | 專有 | 未公開 | 長文本處理優秀,安全性設計佳 | 僅雲端可用,開源社群少 | 文件總結,合規場景 |
▋下回預告
下一篇將總結我們的最終成果,並談談未來的應用展望。
▋參考資料
LLaMA Paper
Falcon LLM
Mistral AI
Ollama