最近公司有偶發性對外網路斷線,一個月可能發生2次,但都是瞬間短期的
症狀大概是User反應mail寄不出去,外部寄不進來,內部互寄是ok的,查log確實是named導致的
那也大概發現問題是對網網路瞬斷後導致dns服務異常,因為內部檔案伺服器、ERP都是正常服務的,對外上傳的電子發票也會出現問題
那MAIL SERVER部分這時候重啟named就可以解決
目前有設定排程每日重啟了
但我想問一下如何設定監控DNS服務遇到異常後多久可以自動重啟
或者是named.conf裡面該如何設定??
上面這個當然是治標不治本,但能讓USER能不察覺異常繼續使用當然是好事
再來就是想請問一下網路斷線該從何查起了
因為是偶發性,原因我想了一下有很多,但是會讓總體網路斷線可能就要歸類硬體面了,目前會影響對外的就小烏龜、防火牆
防火牆是用100D,目前看是沒有防火牆重啟紀錄,但其他系統異常訊息我真的看不出來,或者要查哪個keyword才知道???
另外小烏龜就無法偵測了嗎? 還是防火牆可以設定什麼來偵測??
最後還有想會不會是中華電信的問題,因為我們搬來這棟園區大樓約4個月而已
還請神人幫幫我解析給我方向,感謝!
寫一個批次檔 如/etc/chkdns.sh
#!/bin/bash
dns_flag=$(ps -A|grep 'named')
if [ "$dns_flag" != "" ]; then
echo "Good ! DNS Server OK.. !!"
else
service named restart
echo "DNS Server fail. Restart. !!"
fi
再用root 排程crontab -e 每5分鐘檢查一次
*/5 * * * * /etc/chkdns.sh
應該能解決您的DNS困擾
斷線應該也可以寫排程去檢查,功力不足尚無法提供解法
補充一下
https://chrome.google.com/webstore/detail/internet-connection-monit/hgccfdagfbilbdbkgmfdmmdfmjjoakfo/related
改用這個,使用上比較直覺