iT邦幫忙

2025 iThome 鐵人賽

DAY 12
0

▋前言


在系統中,我們不只要做逐字稿與情緒分析,還希望能生成「教學摘要」與「學習建議」。這就需要引入大型語言模型 (LLM)。

▋內容


比賽有一個限制:不得使用雲端 API。這意味著像 GPT-4、Claude 這些雲端模型都不能使用。我們必須尋找地端可運行的開源模型。

我們比較過幾種 LLM:

  1. LLaMA (Meta)

    優點:開源,社群活躍,資源多。

    缺點:推理速度比 GPT-4 慢,需要 GPU 支援。

  2. Falcon

    優點:開源許可友善,能在中小型硬體環境下跑。

    缺點:英文表現佳,但在中英文混合任務上稍弱。

  3. Mistral

    優點:小型化設計,能效比佳。

    缺點:模型成熟度與生態系仍在發展中。

最終我們選擇 Ollama + LLaMA 模型,原因是:

  1. 能完全離線運行,符合資料保護規範。

  2. 能夠整合逐字稿與情緒數據,生成教學摘要。

  3. 推理品質在教育場景中已足夠實用。

請ChatGPT幫我們整理一個易讀的比較表:

模型 開發單位 開源/授權 模型大小 優點 缺點 適用場景
LLaMA 2 Meta AI 開源(需申請) 7B / 13B / 70B 社群活躍,資源豐富,多語言能力佳 推理速度慢,需高效能 GPU 通用 NLP 任務,教育研究,地端應用
Falcon TII UAE 開源 (Apache 2.0) 7B / 40B 授權友善,英文任務表現好,效能高 中英文混合表現一般 英文會議摘要,客戶服務,研究應用
Mistral Mistral AI 開源 (Apache 2.0) 7B 高效能小模型,適合中小型 GPU 生態系仍在發展,工具鏈不如 LLaMA 完整 輕量級應用,教育場合,低資源環境
GPT-4 OpenAI 專有 未公開 最強通用性,跨語言支援廣泛 需雲端 API,無法完全離線 商業應用,雲端聊天機器人
Claude 3 Anthropic 專有 未公開 長文本處理優秀,安全性設計佳 僅雲端可用,開源社群少 文件總結,合規場景

▋下回預告


下一篇將總結我們的最終成果,並談談未來的應用展望。

▋參考資料


LLaMA Paper
Falcon LLM
Mistral AI
Ollama


上一篇
Day 11 最終報告與成果呈現
下一篇
Day 13 最終成果與未來展望
系列文
AI語音辨識系統:結合聲紋分析與情緒識別15
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言