📌 為什麼要做這個挑戰?
生成式 AI 正在改變世界,但市面上大多數服務(如 ChatGPT、Claude、Gemini)都依賴雲端:
問題 1:成本
長時...
這幾天接連講了一些跟 LLM 有關的概念,最後一天,要來介紹如何使用 Ollama 在本機端離線使用大型語言模型,並且會介紹一個使用 LLM 的介面:Open...
在前一天,我們整理了深度學習中常見的優化方法,從最基本的隨機梯度下降 (SGD),到 Momentum、RMSProp、Adagrad 等。今天我們要深入介紹其...
影片連結:https://www.youtube.com/watch?v=MOfRXaZcwMEYouTube 頻道:https://www.youtube....
前言
今天我們要來聊聊 LLM 的微調技巧。因為 Whisper 是一個參數量非常大的模型,所以我們會簡單介紹一下什麼是 QLoRA,還有怎麼在程式裡面進行量化...
上一篇文章我們談論完 Evaluation 中的評估方式以後,接下來我們將要談論 :
評估指標
然後還記得我們前一篇文章在建立 Evaluator 時看到...