1.建立Host時會要求選擇Group,可以有多個Group,分組可以用來做告警發給特定人士或儀表板等用途。
2.接著Link templates,templates可以增加監控項目 EX.ping,加速監控設定,當然也可以不用templates,直接在host建立專屬的items。
3.Triger監控items收集到的data,運算後觸發規則,轉換狀態從正常到告警
4.Action可以設定某個group或host,狀態變成告警,發送訊息給那些人
在1-3的時候有設定Template Module ICMP Ping跟Template OS Linux是已經預設好要監控什麼服務(item)
點進Template OS Linux裡面有許多items
Type:Zabbix agent 表示要裝agent才能收資料,其他還有IPMI(實體server)Snmp(網通設備)和simple check (ping or tenlet)...
Key: 旁邊有select 可以跑出功能選單
Type: 整數or浮點數
units: 單位,如果是回應時間這裡就是s
update: 更新監控時間,越短越頻繁
history:紀錄保持時間
Trend:超過紀錄保持時間會將數據依時間合併ex. 1小時的數值合併成最大、最小、平均值,減少空間消耗在拉儀錶板數值時會因此產生誤差
Show Value: 假設收到資料為1/0可以轉換成up/down訊息
Linux CPU,Memory監控
預設沒有百分比顯示,自己對資料在做計算
Type選擇Calculated可以做數值運算
https://www.zabbix.com/documentation/3.4/zh/manual/config/items/itemtypes/calculated
假設100%-CPU idle% 為 CPU使用率
100-last(“system.cpu.util[,idle]")
Memory預設使用使用量跟最大量,運用Calculated算出使用率
last(“vm.memory.size[available]")/last(“vm.memory.size[total]")
ping監控
zabbix icmp是使用fping做監控
https://www.zabbix.com/documentation/3.0/manual/config/items/itemtypes/simple_checks
icmppingloss[,,,,]
預設是60秒觸發一次 fping每1秒檢查一次共檢查三次
fping -C 3 8.8.8.8
8.8.8.8 : [0], 84 bytes, 5.07 ms (5.07 avg, 0% loss)
8.8.8.8 : [1], 84 bytes, 2.39 ms (3.73 avg, 0% loss)
8.8.8.8 : [2], 84 bytes, 2.79 ms (3.41 avg, 0% loss)
這個監控方式只能拿來偵測網路是否斷了,我們可以改設定為每2秒檢查一次共檢查30次
icmppingloss[,30,2000,,]
或者是10秒觸發一次,fping每1秒檢查一次共十次(很耗效能)
icmppingloss[,10,,,]