了解SNMP 的運作機制,以及如何利用它來實現主動、預防性的網路設備健康檢查。
Manager (管理器/NMS): 運行監控軟體(如 Zabbix, Nagios, PRTG)的工作站,負責發送請求。
Agent (代理): 運行在網路設備(路由器、交換器)上的軟體,負責收集數據並回應管理器。
MIB (Management Information Base): 設備上資料庫的標準化結構,定義了所有可查詢的對象(例如 CPU 負載、介面流量計數器)。
基本操作: 講解 GET (取值)、SET (設值,通常禁用) 和 TRAP (設備主動通知) 這三種核心操作。
SNMP 用於檢查網路設備的內部健康狀態,以下是四大關鍵指標及其對應的 MIB (Management Information Base) 概念。
核心監控指標 | 查詢對象 (MIB 概念) | 意義與故障排除方向 |
---|---|---|
CPU 使用率 | 系統 MIB 或處理器 MIB | 應用: 持續高 CPU 通常指向路由協定計算過度(如 OSPF/BGP 震盪)、STP 拓撲變動,或軟體錯誤。 |
記憶體使用率 | 記憶體 MIB | 應用: 監控設備記憶體洩漏或耗盡。特別是 Process Memory,若持續上升可能導致設備不穩定或服務崩潰。 |
介面流量與利用率 | 介面 MIB (IF-MIB) | 應用: 監控介面帶寬佔用率。用來確認 NetFlow 分析的結果,輔助定位網路鏈路是否成為瓶頸。 |
介面錯誤率 | 介面 MIB (錯誤封包計數器) | 應用: 檢查 CRC 錯誤、丟包 (Drops) 和 Input/Output Errors。高錯誤率通常指向線材損壞、SFP 模組故障或雙工不匹配(Duplex Mismatch)。 |