iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

0 Like 0 留言 2885 瀏覽

鐵人賽生成式 AI DAY 29

Local LLM infra & Inference 一部曲系列第 29 篇

技術 Day29 - vLLM實作篇PART5：監控vLLM

前言接續昨天的監控介紹和 Day24 的實作篇，今天就要來介紹如何使用開源工具Prometheus和Grafana來監控vLLM的一些硬體與推理指標，最後實作...

母湯小精靈 ‧ 2024-09-30 ‧團隊為了AI而AI

0 Like 0 留言 5827 瀏覽

鐵人賽生成式 AI DAY 25

Local LLM infra & Inference 一部曲系列第 25 篇

技術 Day25 - vLLM實作篇PART4：安裝到推理 (Windows version)

前言前面講完linux的vLLM安裝使用，這次來介紹Windows版本的使用方式，筆者之前剛好借到一台windows電腦+RTX 4060 Ti * 2，就用...

母湯小精靈 ‧ 2024-09-26 ‧團隊為了AI而AI

0 Like 0 留言 1782 瀏覽

鐵人賽生成式 AI DAY 24

Local LLM infra & Inference 一部曲系列第 24 篇

技術 Day24 - vLLM實作篇PART3：FastAPI與vLLM docs尋寶之旅

前言第24天了！最後就在官方文件裡面撈看看還有什麼可以玩的。 ✨ 首先是安裝方式，除了之前試過的linux GPU版本安裝之外，官方文件還提供了linux C...

母湯小精靈 ‧ 2024-09-25 ‧團隊為了AI而AI

1 Like 0 留言 4764 瀏覽

鐵人賽生成式 AI DAY 23

Local LLM infra & Inference 一部曲系列第 23 篇

技術 Day23 - vLLM實作篇PART2：模型平行化 / 預測推理 / 其他設定

前言昨天的教學中，已經學會設定基本的OpenAI-Compatible Server方法了。簡單回顧一下，若是什麼也沒設定，預設會是使用一個GPU。 🎮 筆...

母湯小精靈 ‧ 2024-09-24 ‧團隊為了AI而AI

0 Like 0 留言 5461 瀏覽

鐵人賽生成式 AI DAY 22

Local LLM infra & Inference 一部曲系列第 22 篇

技術 Day22 - vLLM實作篇PART1：安裝到推理 (Linux version)

🚀 vLLM介紹 vLLM是一個速度快、靈活又簡單好用的推理加速框架，主打使用PagedAttention管理kv cache，Model Paralleliz...

母湯小精靈 ‧ 2024-09-23 ‧團隊為了AI而AI

1 Like 0 留言 3757 瀏覽

鐵人賽生成式 AI DAY 28

2024 年用 LangGraph 從零開始實現 Agentic AI System 系列第 28 篇

技術【Day 28】- 從零開始的 DSPy：打造高效翻譯錯誤檢測系統

摘要這篇文章介紹了一個名為 DSPy 的 AI 開發框架，它能夠幫助開發者更有效地構建和優化語言模型。文章從一個翻譯錯誤檢測任務為例，一步一步地示範了如何使用...

hengshiousheu ‧ 2024-09-26

0 Like 0 留言 449 瀏覽

鐵人賽 AI/ ML & Data DAY 22

30 Days of AI Research 系列第 23 篇

技術 [Day 22] PaLM-E: An Embodied Multimodal Language Model

Paper link | Note link | Code link | ICML 2023 整體想法這篇研究嘗試通過整合包括圖像在內的多模態資訊來開發一...

whoami ‧ 2024-08-22

0 Like 0 留言 338 瀏覽

鐵人賽 AI/ ML & Data DAY 21

30 Days of AI Research 系列第 22 篇

技術 [Day 21] ILLUME: Rationalizing Vision-Language Models through Human Interactions

Paper link | Code link | ICML 2023 整體想法這項研究採用了人機互動的解釋方法來處理多模態 Transformers 模型...

whoami ‧ 2024-08-21

0 Like 0 留言 524 瀏覽

鐵人賽 AI/ ML & Data DAY 20

30 Days of AI Research 系列第 21 篇

技術 [Day 20] Visual Instruction Tuning

Paper link | Note link | Code link | NeurIPS 2023 整體想法這項研究展示了視覺指令調整的有效性。他們引入...

whoami ‧ 2024-08-20

0 Like 0 留言 504 瀏覽

鐵人賽 AI/ ML & Data DAY 19

30 Days of AI Research 系列第 20 篇

技術 [Day 19] Compressing and Debiasing Vision-Language Pre-Trained Models for Visual Question Answering

Paper link | Code link | EMNLP 2023 整體想法這項研究首次聯合探討了視覺語言預訓練模型（VLP）在視覺問答（VQA）任務...

whoami ‧ 2024-08-19

0 Like 0 留言 761 瀏覽

鐵人賽 AI/ ML & Data DAY 18

30 Days of AI Research 系列第 19 篇

技術 [Day 18] Evaluating Object Hallucination in Large Vision-Language Models

Paper link | Note link | Code link | EMNLP 2023 整體想法這項研究對多個大型視覺語言模型（LVLMs）進行了...

whoami ‧ 2024-08-18

4 Like 1 留言 9175 瀏覽

鐵人賽 AI & Data DAY 17

LLM 學習筆記系列第 17 篇

技術 LLM Note Day 17 - vLLM & Paged Attention

簡介 vLLM 是來自 UC Berkeley 的 Woosuk Kwon 和 Zhuohan Li 所製作的推論框架，使用 Paged Attention 技...

Penut Chen ‧ 2023-10-02 ‧團隊消波塊上的海洋貓貓