iT邦幫忙

vllm相關文章
共有 12 則文章
鐵人賽 生成式 AI DAY 29

技術 Day29 - vLLM實作篇PART5:監控vLLM

前言 接續昨天的監控介紹和 Day24 的實作篇,今天就要來介紹如何使用開源工具Prometheus和Grafana來監控vLLM的一些硬體與推理指標,最後實作...

鐵人賽 生成式 AI DAY 25

技術 Day25 - vLLM實作篇PART4:安裝到推理 (Windows version)

前言 前面講完linux的vLLM安裝使用,這次來介紹Windows版本的使用方式,筆者之前剛好借到一台windows電腦+RTX 4060 Ti * 2,就用...

鐵人賽 生成式 AI DAY 24

技術 Day24 - vLLM實作篇PART3:FastAPI與vLLM docs尋寶之旅

前言 第24天了!最後就在官方文件裡面撈看看還有什麼可以玩的。 ✨ 首先是安裝方式,除了之前試過的linux GPU版本安裝之外,官方文件還提供了linux C...

鐵人賽 生成式 AI DAY 23

技術 Day23 - vLLM實作篇PART2:模型平行化 / 預測推理 / 其他設定

前言 昨天的教學中,已經學會設定基本的OpenAI-Compatible Server方法了。 簡單回顧一下,若是什麼也沒設定,預設會是使用一個GPU。 🎮 筆...

鐵人賽 生成式 AI DAY 22

技術 Day22 - vLLM實作篇PART1:安裝到推理 (Linux version)

🚀 vLLM介紹 vLLM是一個速度快、靈活又簡單好用的推理加速框架,主打使用PagedAttention管理kv cache,Model Paralleliz...

鐵人賽 生成式 AI DAY 28

技術 【Day 28】- 從零開始的 DSPy:打造高效翻譯錯誤檢測系統

摘要這篇文章介紹了一個名為 DSPy 的 AI 開發框架,它能夠幫助開發者更有效地構建和優化語言模型。文章從一個翻譯錯誤檢測任務為例,一步一步地示範了如何使用...

鐵人賽 AI/ ML & Data DAY 22
30 Days of AI Research 系列 第 23

技術 [Day 22] PaLM-E: An Embodied Multimodal Language Model

Paper link | Note link | Code link | ICML 2023 整體想法 這篇研究嘗試通過整合包括圖像在內的多模態資訊來開發一...

鐵人賽 AI/ ML & Data DAY 21
30 Days of AI Research 系列 第 22

技術 [Day 21] ILLUME: Rationalizing Vision-Language Models through Human Interactions

Paper link | Code link | ICML 2023 整體想法 這項研究採用了人機互動的解釋方法來處理多模態 Transformers 模型...

鐵人賽 AI/ ML & Data DAY 20
30 Days of AI Research 系列 第 21

技術 [Day 20] Visual Instruction Tuning

Paper link | Note link | Code link | NeurIPS 2023 整體想法 這項研究展示了視覺指令調整的有效性。 他們引入...

鐵人賽 AI/ ML & Data DAY 19
30 Days of AI Research 系列 第 20

技術 [Day 19] Compressing and Debiasing Vision-Language Pre-Trained Models for Visual Question Answering

Paper link | Code link | EMNLP 2023 整體想法 這項研究首次聯合探討了視覺語言預訓練模型(VLP)在視覺問答(VQA)任務...

鐵人賽 AI/ ML & Data DAY 18
30 Days of AI Research 系列 第 19

技術 [Day 18] Evaluating Object Hallucination in Large Vision-Language Models

Paper link | Note link | Code link | EMNLP 2023 整體想法 這項研究對多個大型視覺語言模型(LVLMs)進行了...

鐵人賽 AI & Data DAY 17
LLM 學習筆記 系列 第 17

技術 LLM Note Day 17 - vLLM & Paged Attention

簡介 vLLM 是來自 UC Berkeley 的 Woosuk Kwon 和 Zhuohan Li 所製作的推論框架,使用 Paged Attention 技...