前言
從這章開始,將進入推理加速相關技術的理論章節 🚀。
這些理論都已經都有被應用在一些知名框架當中,其實3分鐘就可以輕鬆應用了。但是如果客戶或面試官問說這些...
1-7 RAG:檢索增強生成技術介紹
RAG (Retrieval-Augmented Generation) 是一種混合型自然語言處理(NLP)模型,它結合...
終於要到了尾聲,接下來要介紹的是怎麼去評測RAG這邊參考了一些文獻,自己整理出的幾項標準與工具!
除了上述,還有許多種的評估指標
BLEU (Bilingu...
本日程式碼同步於 Github
有一些問題…
昨天我們讓模型可以透過 <API> 這樣的特殊符號,來使用外部函式,結果相當不錯,真的都有算對。大家也...
第一隻AI程式
寫程式不免俗要來個 Hello World,依據開發 Spring Boot 程式的經驗,我們只需定義變數,並透過自動注入的機制就能開始使用,為...
前言
在 Day6 的時候我們提到當context length越長,KV cache也會越大,分配KV cache也成為一個挑戰的工作 🧠。在 Day12 學...