iT邦幫忙

2021 iThome 鐵人賽

DAY 13
0
DevOps

中台化轉型系列 第 13

基礎建設: 系統監控與告警

系統架構

系統監控是維護資源可靠性、可用性與效能的重要環節。

  • 指標計算
    • 即時計算:即時的本地服務指標更新
    • 日誌統計:整體資源的指標計算,例如:叢集服務的QPS指標。
      • 離線計算:使用Hive、Spark
      • 串流計算:使用Flink、Storm
  • 監控系統
    • 主動獲取:利用Prometheus系統及代理程式主動收集所需監控資料。
    • 被動獲取:收集系統日誌。
  • 告警系統
    依據觸發模式及設置的規則進行即時的告警

計算種類

  • 指標紀錄
  • 指標管理
    • 瞬時(Gauges):系統瞬時尖峰負載
    • 計數(Counter)
    • 速率(Meter)
    • 直方(Histograms):資料分布
    • 性能(Timers):QPS、反應時間
  • 指標介面
    • JSON
    • Prometheus
    • Others

監控系統

  • Prometheus:指標資料收集、儲存、查詢、告警。
  • Service Discovery:提供服務定址功能。
  • Pushgateway:資料主動推送(Pull)介面。
  • AlertManager:告警規則及通知規則操作界面。
  • Grafana:監控儀錶板及操作界面。

上一篇
基礎建設: 事件與訊息系統
下一篇
基礎建設:分散式服務追蹤
系列文
中台化轉型30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言