iT邦幫忙

2018 iT 邦幫忙鐵人賽
DAY 5
0


大概介紹一下Zabbix流程


1.建立Host時會要求選擇Group,可以有多個Group,分組可以用來做告警發給特定人士或儀表板等用途。
2.接著Link templates,templates可以增加監控項目 EX.ping,加速監控設定,當然也可以不用templates,直接在host建立專屬的items。
3.Triger監控items收集到的data,運算後觸發規則,轉換狀態從正常到告警
4.Action可以設定某個group或host,狀態變成告警,發送訊息給那些人

從Template出發開始講

在1-3的時候有設定Template Module ICMP Ping跟Template OS Linux是已經預設好要監控什麼服務(item)

點進Template OS Linux裡面有許多items

用System uptime介紹一下

Type:Zabbix agent 表示要裝agent才能收資料,其他還有IPMI(實體server)Snmp(網通設備)和simple check (ping or tenlet)...
Key: 旁邊有select 可以跑出功能選單
Type: 整數or浮點數
units: 單位,如果是回應時間這裡就是s
update: 更新監控時間,越短越頻繁
history:紀錄保持時間
Trend:超過紀錄保持時間會將數據依時間合併ex. 1小時的數值合併成最大、最小、平均值,減少空間消耗
在拉儀錶板數值時會因此產生誤差
Show Value: 假設收到資料為1/0可以轉換成up/down訊息

進階應用

Linux CPU,Memory監控
預設沒有百分比顯示,自己對資料在做計算

Type選擇Calculated可以做數值運算
https://www.zabbix.com/documentation/3.4/zh/manual/config/items/itemtypes/calculated

假設100%-CPU idle% 為 CPU使用率

100-last(“system.cpu.util[,idle]")

Memory預設使用使用量跟最大量,運用Calculated算出使用率

last(“vm.memory.size[available]")/last(“vm.memory.size[total]")

ping監控
zabbix icmp是使用fping做監控
https://www.zabbix.com/documentation/3.0/manual/config/items/itemtypes/simple_checks
icmppingloss[,,,,]
預設是60秒觸發一次 fping每1秒檢查一次共檢查三次

fping -C 3 8.8.8.8
8.8.8.8 : [0], 84 bytes, 5.07 ms (5.07 avg, 0% loss)
8.8.8.8 : [1], 84 bytes, 2.39 ms (3.73 avg, 0% loss)
8.8.8.8 : [2], 84 bytes, 2.79 ms (3.41 avg, 0% loss)

這個監控方式只能拿來偵測網路是否斷了,我們可以改設定為每2秒檢查一次共檢查30次

icmppingloss[,30,2000,,]

或者是10秒觸發一次,fping每1秒檢查一次共十次(很耗效能)

icmppingloss[,10,,,]

上一篇
2-1.監控工具之二:Grafana
下一篇
1-5.監控工具之一:Zabbix Triggers
系列文
成長型維運平台 - 單人新手到多人團隊都適用的工具11

尚未有邦友留言

立即登入留言