前言 在本系列文章中,我著重於如何透過良好的告警事件管理來減輕維運人員的負擔,並降低 MTTR(平均修復時間)等關鍵指標。維運人員常見的告警痛點包括:告警疲勞(...
RBAC (Role-Based Access Control) 基於角色的存取控制 (RBAC) 是一種控制資源存取的方法。使用者透過角色與作為安全目標的系統...
Kubernetes 是一個非常受歡迎的系統,可以幫助公司和開發者管理容器化的應用程式。隨著 Kubernetes 的普及,確保叢集和應用的安全變得非常重要。但...
Kubernetes API 是整個 Kubernetes 集群的核心。它負責處理所有的操作請求,包括創建、更新、刪除和查詢 Kubernetes 資源。因此,...
在開始實作之前,讓我們稍微複習 VPA 是什麼: Vertical Pod Autoscaler(簡稱 VPA ) 自動更新工作負載資源(例如 Deploym...
在開始實作之前,讓我們稍微複習 HPA 是什麼: HorizontalPodAutoscaler(簡稱 HPA ) 自動更新工作負載資源(例如 Deploym...
在 Kubernetes 中,我們可以根據當前的資源需求擴展和縮減工作負載。 這讓叢集可以更靈活、更高效地面對資源需求的變化。 擴縮工作負載大致上分為兩種方式,...
在 AWS 中,但凡我們開啟的 EC2 Instance,都會自動產生對應的 Metrics。這些 Metrics 可以幫助我們監控 Instance 的即時狀...
歡迎來到我們 30 天 DevOps 挑戰的最後一天!給自己歡呼一下! 今天,就讓我們一起來回顧這段旅程,以及未來還有那些值得探索的技術吧~ 回顧整體挑戰過程...
完賽心得 鐵人賽挑戰的最後一天終於到來了。相比於前兩年的參賽經驗,我今年投入了更多的時間和精力,即便提前兩個半月開始準備,依然寫到了最後一天才完成所有內容。...
今天讓我們休息一下,分享一下完賽的感想,順便放鬆一下心情。這段時間真的充滿了挑戰與成長的經歷,也算是一個小小的慶祝,讓自己稍微喘口氣。 放心,我的參賽文章還沒寫...
在前一天的文章中,我們已經準備好了一個 Nginx 的靜態網站,並且完成了容器化。今天,我們將繼續練習將這個靜態網站佈署到 Kubernetes 叢集中,並且介...
前言 在前面的章節中,我們已經對告警事件中心有了初步的了解,並介紹了告警處理的核心服務,包括 Prometheus Alertmanager 和 Grafan...
當多個團隊或使用者共用同一個 Kubernetes 叢集時,資源競爭是很常見的。為了避免某個團隊的資源使用影響到其他團隊,我們可以使用資源配額來進行限制。在 K...
不知不覺挑戰已經到了尾聲,在最後幾天的文章中,我們將要用前幾天學到的技能,從零開始建立一個 Nginx 的靜態網站,最終將其佈署到 Kubernetes 中。本...
前言 在之前探討告警事件中心的章節中,我們已經對 Prometheus AlertManager 和 Grafana Alerting 有了基本的了解。雖然這...
Kubernetes 資源管理概述 前言 在現代的微服務架構中,我們經常使用容器技術來封裝和運行應用程序。這種方法雖然使部署變得更加便捷和一致,但也帶來了資源管...
在今天的文章中,我們將探討 Kubernetes 叢集中的 災難恢復 與 備份策略。制定一個有效的備份和災難恢復方案,無論是遇到基礎架構的崩潰,還是應用程式的意...
前言 在一個複雜的系統中,告警事件的歷史紀錄是非常重要的。它不僅可以幫助我們了解系統的穩定性,還可以幫助我們找出系統的瓶頸和潛在的問題。Grafana Ale...
上一章節中,我們介紹了如何主動指定 Pod 要部署在哪些節點上。然而在預設情況下,調度器會將 Pod 平均部署在所有可用的節點中。如果我們希望某些節點預設情況下...
前言 在前一章節中,我們已經詳盡地介紹了設定告警規則的各種細節,並深入了解了告警規則在評估過程中所經歷的不同狀態變化及其所代表的意義。經過這一番學習,相信你已...
在上一章節中,我們瞭解了調度的基本邏輯,並初步認識了相關功能。今天,我們將深入探討如何透過各種方式控制 Pod 的調度,特別是如何將 Pod 指派到特定的節點上...
在現代應用程式的開發和維運過程中,安全地處理包括 API 密鑰、資料庫憑證、OAuth token 等,敏感資訊變得非常重要。如果這些資訊被未經授權的用戶取得,...
前言 在經過了先前對於 Grafana Alerting 與 Prometheus AlertManager 的介紹後,我們對於告警事件系統的觀念已經有了基本...
隨著 DevOps 實踐的普及,基礎架構即程式碼 (Infrastructure as Code, IaC) 已成為現代 IT 管理的重要措施。而 Terraf...
前言 在現代可觀測性世界中,告警事件管理是確保服務穩定運行的關鍵,無論是雲端、地端以及各種分佈式系統中,精準即時的告警能夠幫助我們快速發相問題,接著進行故障排...
Kubernetes 作為現代應用程序的主要編排工具,能夠幫助開發者和運維團隊高效地管理和調度容器化工作負載。為了確保集群的資源分配和管理更加靈活、穩定,Kub...
昨天的章節,我們實作了 Recreate,Rolling update 兩個部署策略。今天來繼續實作剩下的策略。 實作: Canary 在 Kubernetes...
昨天的章節中,我們已經初步的了解多種部署策略的原理,但只看不做可感受不到部署策略的魅力。在接下來的兩天,我們將透過大量實作來熟悉它們。 實作: Recreate...
前言 現代化系統中,監控與告警系統在日益複雜的服務環境中扮演著至關重要的角色。而我們在這背景下,以 AlertManager 這個百分之九十以上與 Prome...