iT邦幫忙

0

關於Zabbix監控異常,Zabbix agent is unreachable for 5 minutes (已自行解決,感謝各位)

  • 分享至 

  • xImage

小弟因位自學網管的技術,所以很多都是看網路的推薦參照網路的方式去學習

之前有玩過Cacti,有成功監控,但現在換玩Zabbix的時候,發現有報錯

小弟是使用,
虛擬機:VirtualBox
虛擬機A (IP:192.168.56.1)去監控另外一台虛擬機B(172.17.x.x),
虛擬機B 有做橋接介面卡配置靜態IP

zabbix控制台,報錯「Zabbix agent on N130scott is unreachable for 5 minutes」
https://ithelp.ithome.com.tw/upload/images/20190129/20114520SQaWene0I1.png
https://ithelp.ithome.com.tw/upload/images/20190129/20114520GIxZgzO37n.png
根據google查詢後,查看虛擬機A和B的Log,「/var/log/zabbix/zabbix_agentd.log」
虛擬機A
「11860:20190129:132656.715 no active checks on server [127.0.0.1:10051]: host [Zabbix server] not monitored」
https://ithelp.ithome.com.tw/upload/images/20190129/20114520aFr0upkuqg.png

虛擬機B
「1103:20190129:150832.302 failed to accept an incoming connection: connection from "172.16.16.99" rejected, allowed hosts: "192.168.56.1"」
https://ithelp.ithome.com.tw/upload/images/20190129/20114520EwJG30LPge.png

這邊判斷應該是虛擬機B的問題,但我查看了zabbix_agentd.conf,裡面的重點配置如下
Server=192.168.56.1
ListenIP=0.0.0.0
ServerActive=192.168.56.1
Hostname=Zabbix server

忙了一下午,不管是將虛擬機A換成靜態IP,還是把虛擬機B換回192.168.56.1,結果都一樣
希望能在這邊求救各位大大

看更多先前的討論...收起先前的討論...
Server=192.168.56.1
#ListenIP=0.0.0.0
ServerActive=192.168.56.1:10051
Hostname=N130scott

這樣咧?
踏雪尋梅 iT邦研究生 5 級 ‧ 2019-01-30 09:15:27 檢舉
試試看
踏雪尋梅 iT邦研究生 5 級 ‧ 2019-01-30 09:19:52 檢舉
異常狀態一樣@@
被動模式加上去.
ListenPort=10050
在192.168.56.1跑
zabbix_get -s 172.16.16.99 -p 10050 -k "system.hostname"
看看有沒有抓到agent
踏雪尋梅 iT邦研究生 5 級 ‧ 2019-01-30 10:00:33 檢舉
加上去了,我的虛擬機B-IP:172.16.16.72
首先我比較不明白 172.16.16.99 是怎麼來的用意
執行zabbix_get -s 172.16.16.99 -p 10050 -k "system.hostname"
「zabbix_get [16336]: Get value error: cannot connect to [[172.16.16.99]:10050]: [111] Connection refused」 連接被拒絕

zabbix_get -s 172.16.16.72 -p 10050 -k "system.hostname"

則會報錯,連接超時
froce iT邦大師 1 級 ‧ 2019-01-30 10:35:08 檢舉
virtualbox的網路模式是哪種?
NAT還是bridge?
踏雪尋梅 iT邦研究生 5 級 ‧ 2019-01-30 10:37:22 檢舉
監控端是NAT,我有試過改用bridge,也仍然無效

被監控端是bridge
踏雪尋梅 iT邦研究生 5 級 ‧ 2019-01-30 10:38:02 檢舉
我現在監控端去ping 被監控端,ping的到

但是被監控端 ping不到 監控端
喔..我以為你的agent是172.16.16.99.
trace一下兩台電腦的路由是怎麼跑的吧.
踏雪尋梅 iT邦研究生 5 級 ‧ 2019-01-30 10:43:23 檢舉
哦,不是,我意思是說,我的被監控端(虛擬機B)LOG,為何會有172.16.16.99這個部分
VM-B 172.16.16.72 去問VM-A 192.168.56.1會得到172.16.16.99. 這要去問VM主機丫. 要看你的VM是怎麼設計的. NAT做怪吧.
踏雪尋梅 iT邦研究生 5 級 ‧ 2019-01-30 11:11:43 檢舉
我研究一下trace怎麼用 (還是學生,哈哈,會的都是照做而已)

我現在查看我監控端LOG,紀錄卡在昨天
「11855:20190129:135101.936 Got signal [signal:15(SIGTERM),sender_pid:23275,sender_uid:0,reason:0]. Exiting ...
11855:20190129:135101.937 Zabbix Agent stopped. Zabbix 3.2.11 (revision 76339).」

是不是監控端掛了?

另外我下zabbix_get -s 172.16.16.34 -p 10050 -k "system.hostname"

會報「Check access restrictions in Zabbix agent configuration」
踏雪尋梅 iT邦研究生 5 級 ‧ 2019-01-30 11:14:27 檢舉
另外,我的被監控有兩台,一台.34、一台.72
.72 是 今天早上新的 (我怕.34被我用到亂掉,就裝新的)
但是.72 好像有其他異常,我就把它砍了

現在都用.34 (也就是文中的虛擬機B)
踏雪尋梅 iT邦研究生 5 級 ‧ 2019-01-30 11:25:29 檢舉
我這邊下 ps aux |grep zabbix,查看確實監控是有開著的
froce iT邦大師 1 級 ‧ 2019-01-30 14:49:05 檢舉
建議:
重建,server和client都用bridge或都用nat,確保在同一網段(通常bridge會比較好處理)。

看到172.16那個IP我就懷疑你是nat在作怪了。
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 個回答

0
echochio
iT邦高手 1 級 ‧ 2019-01-30 15:08:11

看 log

failed to accept an incoming connection: connection from "172.16.16.99" rejected, allowed hosts: "192.168.56.1"

不是告知你 ....

無法接受傳入連接:來自“172.16.16.99”的連接被拒絕,允許主機:“192.168.56.1”

zabbix_agentd.conf 配成這樣

Server=172.16.16.99
ListenIP=0.0.0.0
ServerActive=172.16.16.99
Hostname=Zabbix server

Server 端(虛擬機A) 裝 zabbix-get 套件
Server 端用指令去試 client (虛擬機A 連 虛擬機B 的 zabbix-agent 取值 )

zabbix_get -s 172.17.x.x -p 10050 -k 'system.cpu.load[all,avg5]'
踏雪尋梅 iT邦研究生 5 級 ‧ 2019-01-30 15:25:25 檢舉

我這邊報

zabbix_get [4544]: Check access restrictions in Zabbix agent configuration

訪問被限制

echochio iT邦高手 1 級 ‧ 2019-01-30 15:39:37 檢舉

您還沒看出來 ?
您 server 到 clent 是 nat 的 ....
您由 server 去 ssh client 登入後 打 "w"
看 server 連 client 的 IP 是哪一個 ?
那個IP 對 client 來說就是 zabbix-server IP

我要發表回答

立即登入回答