前言
在 Day 19 我們談到監控與告警,讓我們可以「看到」叢集發生了什麼事,也能在異常時即時收到提醒。但除了被動監控之外,叢集其實還需要一種 主動調整資源...
承接 Day 16(Isaac + Selkies 同 Pod)。今天把 GPU 監控補齊:用 DCGM Exporter 暴露 GPU 指標,交給 Prom...
昨天我們學會怎麼在 Cloud Run Service 上建立 AI Agent,但文件上說 Vertex AI 能夠由 Google Cloud 完美地管理,...
大家好!歡迎來到我在 2025 年 iThome 鐵人賽的系列文章。
我是一位從文組轉職、還在雲原生路上一路學習的軟體工程師 (年資大概 5 個月)。在公司的專...
前言
到目前為止,我們的 EKS Cluster 已經能跑 Pod、能控制排程,但還有一個大問題:Pod 怎麼取得 AWS 資源的存取權限?
在現實環境裡,許多...
前言:為什麼要讀官方文件?
Kubernetes (K8s) 已是現代雲原生應用程式的作業系統,也是所有後端工程師的必修課。然而,K8s 功能強大、體系龐雜,加...