iT邦幫忙

2021 iThome 鐵人賽

DAY 18
0
Security

監控大挑戰 - 以 Zabbix 為例系列 第 18

Day 18. Zabbix 整合儀表板介紹

Hi 大家今天介紹 Dashboard 的功能,30 天到現在還沒有大家介紹說到底是否有警報。

對於這個警報畫面大家應該都再熟悉不過了,基本上只要登入就會進到這一頁。對於預設的畫面,還蠻適合當監控室的,目前是還在伺服器管理研究小組管理使用,之後畢竟服務是提供給開發人員,所以會希望開發人員也能知道自己使用的主機狀況,達到彼此交流。最後希望在行雲者研發基地的螢幕上這麼畫面,只要經過的人都可以看一下有甚麼問題。

首先就是有基本的傳統時鐘。


這框框就會代表 整個 Zabbix 運作的總狀態~

  • Zabbix server is running : 補充說明 Web 介面與 Zabbix Server 是可以拆開的唷,所以如果不想用Web 介面可以不用安裝,Zabbix 有出 API,所以如果要介接第三方WEB介面做整合也不是太困難唷,比較常聽到的是 Grafana。

  • Number of templates 、 Number of hosts (enabled/disabled) : 可以看出我們有多少樣板可以用,多少主機監控中。

  • Number of items (enabled/disabled/not supported) : 總共監控多少項目(分成 啟動中/關閉的/不支援)。

  • Number of triggers (enabled/disabled [problem/ok]) : 觸發器顧名思義就是超過限制的設定值會跳警報統計。

  • Number of users (online) : 幾位使用者正在線上。

  • Required server performance, new values per second : 數值更新的頻率。

  • Host availability (上) 統計主機狀態 Available :表示已連上線數量,Not available :表示曾經連上線目前斷線數量,Unknown :表示還沒有連上線過。
  • Problems by severity (下) 會依據問題的嚴重程度分類統計。

這個統計圖阿,我們目前運行 Zabbix 版本4.0沒有的(很久沒更新了 XD),這算是這次鐵人賽新發現~

這裡就會出現到底是那些有問題啦~

就會先是跳出警報的時間,是哪一台機器,發生什麼問題,持續多久,就會一覽無疑。如果已經解決的就會自己消失。這些警報都是套上樣板後就會幫我們設定好了,就樣就省下很多功夫。

就可以依據這些項目去排查問題了。至於有沒有問題就要自己判斷喔。像是 Zabbix server Apache: Process is not running 問題,因為我可以正常使用阿,那為什麼會跳錯,說不定是誤判或是沒設定好都是有可能的~

內容如有介紹不周的地方,再麻煩大家提點,感激不盡。
同步發表 行雲部落格 再麻煩大家多多指教 謝謝
行雲者研發基地官網 粉絲專頁


上一篇
Day 17. 常見模板 Template DB MySQL by Zabbix agent 介紹
下一篇
Day 19. Zabbix 上的 script 工具
系列文
監控大挑戰 - 以 Zabbix 為例30

尚未有邦友留言

立即登入留言