當網路設備故障,如何讓網路設備主動告訴你它發生了什麼事。
一、學習目標
掌握網路設備 Syslog 客戶端 的基本配置步驟(以 Cisco 或 Juniper 範例)。
了解如何設定正確的 日誌級別(Severity Level),確保重要錯誤訊息不會被淹沒。
學會解讀幾種最常見的硬體和介面故障碼,從而快速判斷問題類型。
二、配置網路設備發送日誌
網路設備(Router/Switch/Firewall)通常使用 Syslog 協定發送日誌,需要配置目標地址和發送級別。
配置範例 (Cisco IOS):
# 告訴設備 Syslog 伺服器的 IP
logging 192.168.1.5
# 設定發送到 Syslog 伺服器的最低日誌級別 (0=緊急, 7=除錯)
# 建議生產環境設定為 warning (4) 或 higher
logging trap warnings
# 確保設備日誌訊息的時間戳記正確
service timestamps log datetime msec
三、關鍵故障碼的解讀
在中央日誌伺服器中,鎖定來自網路設備的日誌,並學習解讀關鍵的 Syslog 訊息。
Syslog 訊息範例 | 故障級別 | 故障類型 | 動作建議 |
---|---|---|---|
%LINK-3-UPDOWN: Interface GigabitEthernet X/Y, changed state to down |
Error (錯誤) | 介面物理連線中斷(線路或埠口) | 檢查線材、對端設備狀態,或更換 SFP 模組。 |
%SYS-2-MALLOCFAIL: Memory allocation of 1024 bytes failed from YYYY |
Critical (嚴重) | 記憶體不足 | 通常是記憶體洩漏或韌體 Bug,需檢查進程或重啟。 |
%PLATFORM_ENV-1-FAN_FAILED: Fan X failed |
Alert (警示) | 硬體故障:風扇失效 | 需要緊急更換風扇或設備,以免過熱停機。 |
%POWER-5-FANTRAY_STATUS: Fan Tray 1, state is OK |
Notification (通知) | 狀態正常(用於確認或紀錄變更) | 無需處理。 |
四、進階:追蹤路由協議震盪
學會如何從日誌中判斷 路由協定 (OSPF, BGP) 是否因為網路不穩定而導致路由表震盪,這是比物理介面故障更難偵測的問題。