iT邦幫忙

flexgen相關文章
共有 1 則文章
鐵人賽 AI & Data DAY 19
LLM 學習筆記 系列 第 19

技術 LLM Note Day 19 - Offloading Inference

簡介 Offloading Inference 主要在探討如何讓 GPU 與其他裝置一起協同推論,例如有些運算放在 CPU,有些記憶體暫存在硬碟裡面。這類的方法...