[Day 28] K8s Networking: 認識 Service Mesh

2025 iThome 鐵人賽

DAY 28

Cloud Native

EKS in Practice：IaC × GitOps 實戰 30 天系列第 28 篇

17th鐵人賽 service mesh istio kubernetes networking

Jac

2025-09-28 13:18:28

197 瀏覽

分享至

在過去幾天，我們一路聊到 Cilium，看見了它如何用 eBPF 取代 iptables/kube-proxy，並解決了 Pod IP 不夠用的問題。但即使我們已經能掌握 資料平面（Data Plane） 的穩定與高效，實際應用到微服務架構時，仍然會遇到另一個挑戰：服務之間的治理（Service-to-Service Governance）。

這正是 Service Mesh 所要解決的問題。

不過，這篇文章我並不打算深入實作細節，因為關於 Istio 安裝、進階配置的教學，已經有很多優秀的鐵人賽文章可以參考。我這裡比較想聊的是 Service Mesh 的基本概念，以及 Istio 提供的核心能力，算是一個入門簡介，讓還不熟這個領域的讀者能先建立起大方向的認識。

為什麼需要 Service Mesh？

隨著服務數量增多，系統會自然走向「微服務化」。這時候，除了確保 Pod 能互相連線，我們還要面對：

服務之間的安全：要不要強制使用 mTLS？如何保證傳輸加密？
流量管理：我要做藍綠部署、金絲雀發布（canary release），能不能動態控制流量比例？
服務可觀測性：出了問題，要怎麼知道是哪兩個服務之間的呼叫出了狀況？
跨團隊治理：不同團隊的服務互相存取時，有沒有一致的存取策略與可追蹤性？

這些問題光靠 CNI 或 Ingress Controller 很難處理。因為它們只關注 IP 和 Port，並不理解應用層的語意。而 Service Mesh 就是專門解決這一層問題的工具。

Service Mesh 的基本概念

Service Mesh 的核心概念是：把應用的網路功能抽離出來，交給一個獨立的基礎設施處理。

這通常透過兩個部分實現：

Data Plane（資料平面）：由 sidecar proxy（例如 Envoy）組成，部署在每個 Pod 或 Service 旁邊，攔截並處理所有進出該 Pod 的流量。
Control Plane（控制平面）：負責下發策略（policy）、收集 telemetry、協調流量規則，例如 Istio 的 istiod。

比喻來說，Service Mesh 就像是替每個微服務配了一個「專屬保全」，服務自己只要專心處理商業邏輯，保全則會代為檢查訪客身份、記錄誰進誰出，甚至控制誰可以從 VIP 通道進來。

Istio：最知名的 Service Mesh

在眾多 Service Mesh 方案裡，Istio 是最具代表性的。它由 Google、IBM 和 Lyft 合作發起，核心就是 Envoy Proxy + Istiod 控制平面。

Istio 提供了幾個關鍵能力：

流量管理（Traffic Management）
- 可以設定 routing 規則，實現金絲雀部署、A/B 測試、流量分流。
- 這個功能在 Istio 會使用 VirtualService 這個 CRD 來進行實作。
- 例如：90% 的流量走 v1，10% 的流量走 v2。
安全（Security）
- 預設支援 mTLS，確保服務間通訊加密。
- 可以設定 fine-grained 的存取控制（誰能呼叫誰）。
可觀測性（Observability）
- 每個呼叫都能自動產生 metrics、log、tracing，不需要開發者額外修改程式碼。
- 搭配 Prometheus / Grafana / Jaeger，就能直接觀察服務之間的關係。