剛好在 2023 DevOps Day 聽到 Blueswen 在國泰的可觀測性實踐,是一場很啟發且淺顯易懂的演講。於是決定接下來幾個章節以現有 Monitor 介紹跟我們遇到的問題為主題。
Monitor 分成 metrics, log, trace。metrics聚焦在發生什麼事情上,通常拿來看 node pod 使用情況,或是 CPU 等狀況。
我們的 metrics 設定方法很簡單,就是使用 helm 的 aws_cloudwatch_metrics。AWS CloudWatch Metrics 是一個監控服務,監視性能、設定警報並對指標進行分析。
在 EKS 中會收集以下指標類別:
resource "helm_release" "aws_cloudwatch_metrics" {
name = "aws-cloudwatch-metrics"
repository = "https://aws.github.io/eks-charts"
chart = "aws-cloudwatch-metrics"
}