在網路運維實戰中,效率是關鍵。面對任何故障,最有效的方法是遵循 OSI 模型的「由下而上」分層排查原則,並結合我們在前面系列文章中學到的日誌和工具。
以下是將所有故障知識點按 OSI 七層模型歸納的總結清單:
OSI 層級 | 檢查目標/常見故障點 | 關鍵工具/數據 (來自系列文章) |
---|---|---|
L1 (實體層) | 線材、介面實體狀態、SFP/光纖連線 | show interface status (檢查 UP/DOWN 狀態)SNMP (介面錯誤率/CRC 錯誤) |
L2 (數據鏈路) | VLAN ID、Trunking 模式、STP 環路 | show vlan brief , show interface trunk 日誌 (NATIVE_VLAN_MISMATCH , %SPANTREE )VLAN 錯誤會造成區域性通訊失敗。 |
L3 (網路層) | IP 地址、路由表、預設閘道 (FHRP) | show ip route , traceroute VRRP/HSRP (檢查 Active 狀態)OSPF/BGP (檢查鄰居 FULL/UP 狀態) |
L4 (傳輸層) | 埠號阻擋、TCP 連線狀態 | Wireshark (SYN/SYN-ACK 檢查)防火牆日誌 (Action: Deny on TCP/UDP Port)NetFlow (分析連線的 Protocol/Port) |
L7 (應用層/服務) | DHCP、DNS、Web 服務、應用層協議 | DHCP/DNS 日誌 (no addresses available , query timeout )Wireshark (http.response.code )NetFlow (分析應用程式佔用頻寬) |
安全/性能層 | 防火牆 Policy、NAT 轉換、QoS/擁塞 | 防火牆日誌 (Original Src/Dst 轉換)NetFlow (分析 DSCP 標記和高頻寬用戶)SNMP (CPU/記憶體/介面利用率) |
核心原則一:由下而上的分層排查思維
這是解決任何網路故障的黃金準則。當問題發生時,我們應遵循 OSI 模型,從最底層的硬體開始檢查:
L1/L2 實體與鏈路: 檢查線材、介面狀態、VLAN/Trunk 配置、STP 環路。
L3 網路層: 檢查 路由表 是否正確、VRRP/HSRP 閘道是否正常切換、OSPF/BGP 鄰居關係是否穩定。
L4/L7 傳輸與服務: 檢查 DHCP/DNS 服務是否正常,以及防火牆 Policy 是否允許 TCP/UDP 埠號通過。
核心原則二:數據驅動的診斷工具
現代網路排查依賴數據證據,而非單純的 show 命令輸出:
日誌 (Logs): 用於追蹤事件和協定狀態(如 DHCP/DNS 服務日誌、VPN IKE 認證失敗)。
NetFlow/IPFIX: 用於分析 流量內容,回答「誰在做什麼?」(應用程式、頻寬佔用)。
SNMP: 用於監控 設備健康,回答「設備是否過載?」(CPU、記憶體、介面錯誤率)。
Wireshark: 用於 深度封包分析,回答「連線為什麼斷?」(直接觀察 TCP 三向交握、重傳)。