Kubernetes 資源管理概述
前言
在現代的微服務架構中,我們經常使用容器技術來封裝和運行應用程序。這種方法雖然使部署變得更加便捷和一致,但也帶來了資源管...
前言
在深度學習應用中,模型的載入速度和推理效率至關重要,尤其是在大規模部署和高併發場景下。直接從雲端儲存(例如 Google Cloud Storage,G...
上一章節中,我們介紹了如何主動指定 Pod 要部署在哪些節點上。然而在預設情況下,調度器會將 Pod 平均部署在所有可用的節點中。如果我們希望某些節點預設情況下...
Day-27 服務的部署策略 - Argo Rollouts with Prometheus
前言
最後要來介紹 Argo Rollouts 中自動分析功能,自...
前言
前一章節介紹了 Multi-Instance GPUs(MIG) ,屬於硬體層級的分割方法,隔離性強。那有沒有軟體切割法呢?
當然有,那就是 Time-...
在上一章節中,我們瞭解了調度的基本邏輯,並初步認識了相關功能。今天,我們將深入探討如何透過各種方式控制 Pod 的調度,特別是如何將 Pod 指派到特定的節點上...