一. 背景
在傳統的檢索增強生成(RAG)中,模型往往「檢索即用」:檢索到的文件直接交給模型生成答案。這種方式雖然方便,卻容易被錯誤資訊誤導。CRAG(Corr...
我們講到 Speed Layer 就像一隊外送員,專門把 Kafka 新鮮出爐的訂單火速送到資料庫。但是,衝得快不代表不會翻車。今天我們來看第三種真實會發生的「...
至今我們學習的 VGG、ResNet 等模型,它們的設計目標都是追求極致的準確率。然而,這些模型龐大的參數數量和巨大的計算量,使得它們很難被部署到手機、無人機、...
有了AI工具就不用學習機器語言了嗎?不是的,今天我想透過本文的分析,來分享我使用ChatGPT輔助程式設計、撰寫所遇見的問題,以及我認為在AI時代仍需要學習...
在前兩篇文章,我們分別介紹了 RNN (Recurrent Neural Network) 與 LSTM (Long Short-Term Memory)。RN...
前情提要
昨天主要講了一下這系列的目標,主要是以了解 attention 相關為主,並以一個簡單的 LLM 訓練當作開始,我們就來看看怎麼做吧~
github...