iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

vram相關文章

共有 3 則文章

0 人追蹤

追蹤

判斷GPU能跑哪個模型在 ollama.com 找到模型後，在模型頁上顯示模型大小，以「starcoder2 3B」為例https://ollama.com/...

kawa0710 ‧ 2024-09-08

鐵人賽生成式 AI DAY 6

Local LLM infra & Inference 一部曲系列第 6 篇

前言傳統NLP模型比較小，只需要考慮compute bound的，但現在LLM模型很大了，基本上就是考驗memory bound的時代，這章將來介紹LLM與V...

母湯小精靈 ‧ 2024-09-07 ‧團隊為了AI而AI

鐵人賽生成式 AI DAY 13

Local LLM infra & Inference 一部曲系列第 13 篇

前言在 Day6 的時候我們提到當context length越長，KV cache也會越大，分配KV cache也成為一個挑戰的工作 🧠。在 Day12 學...

母湯小精靈 ‧ 2024-09-14 ‧團隊為了AI而AI

參賽組數

902 組

團體組數

37 組

累計文章數

19804 篇

完賽人數

529 人

IT邦幫忙