技術問答
技術文章
iT 徵才
聊天室
2026 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2021 iThome 鐵人賽
DAY
13
0
DevOps
中台化轉型
系列 第
13
篇
基礎建設: 系統監控與告警
13th鐵人賽
HO-HSUN
2021-09-13 00:25:43
1971 瀏覽
分享至
系統架構
系統監控是維護資源可靠性、可用性與效能的重要環節。
指標計算
即時計算:即時的本地服務指標更新
日誌統計:整體資源的指標計算,例如:叢集服務的QPS指標。
離線計算:使用Hive、Spark
串流計算:使用Flink、Storm
監控系統
主動獲取:利用Prometheus系統及代理程式主動收集所需監控資料。
被動獲取:收集系統日誌。
告警系統
依據觸發模式及設置的規則進行即時的告警
計算種類
指標紀錄
指標管理
瞬時(Gauges):系統瞬時尖峰負載
計數(Counter)
速率(Meter)
直方(Histograms):資料分布
性能(Timers):QPS、反應時間
指標介面
JSON
Prometheus
Others
監控系統
Prometheus:指標資料收集、儲存、查詢、告警。
Service Discovery:提供服務定址功能。
Pushgateway:資料主動推送(Pull)介面。
AlertManager:告警規則及通知規則操作界面。
Grafana:監控儀錶板及操作界面。
留言
追蹤
檢舉
上一篇
基礎建設: 事件與訊息系統
下一篇
基礎建設:分散式服務追蹤
系列文
中台化轉型
共
30
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
26
大數據平台:資料倉儲
27
大數據平台:分散式計算
28
大數據平台:分散式檔案
29
大數據平台:訊息中介
30
大數據平台:叢集管理
完整目錄
熱門推薦
{{ item.subject }}
{{ item.channelVendor }}
|
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
902
組
團體組數
37
組
累計文章數
19831
篇
完賽人數
528
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
17th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
linux
windows server
css
react
熱門問題
誰能證明AI是一場公司的大災難
延續誰能證明ai是場災難
鼎新ERP /SMART 專案成本分析..
Connect-AzureAD 的 powershell 指令
Debian 13 安裝 bind9 後找不到範例檔
MATABASE 多期比較問題請教
熱門回答
誰能證明AI是一場公司的大災難
鼎新ERP /SMART 專案成本分析..
Connect-AzureAD 的 powershell 指令
Debian 13 安裝 bind9 後找不到範例檔
熱門文章
好想跟 Discord 聊天就把專案寫好 : Claude Code Channels
AI網管課 - 怎麼建置10人網路 (概念篇)
用 PowerShell 安裝 Claude Code:從 Git、PATH 到 WSL 一次排好(Windows 實測)
如何設計自己的遊戲開發同事
筆記:.NET 併發處理 Async/Await 筆記
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}