[Day26] 防止惡意攻擊：如何通過 VPC 和 Load Balancer 保護核心服務

2024 iThome 鐵人賽

DAY 26

生成式 AI

從系統設計切入，探索 GenAI 在企業中的實踐系列第 26 篇

16th鐵人賽

Yi-Pei, Lee

團隊SI夢想工程隊

2024-09-27 20:16:12

726 瀏覽

分享至

隨著生成式 AI 系統日益複雜，安全性成為設計過程中的一個重要議題。例如，當我們開發一個核心的 generator 服務來處理文本或圖像生成時，這些服務每次請求都會消耗 API token。如果服務對外暴露，可能會面臨惡意攻擊者的頻繁請求，導致 token 快速耗盡，甚至可能引發 DDoS 攻擊，使服務無法正常運行。因此，為了保護這類關鍵服務，我們需要通過虛擬私有網絡（VPC）將服務隔離在內部，並通過負載均衡器來管理流量，限制只有內部授權的服務能夠訪問 generator 服務。

除了安全性之外，微服務之間的通信方式也是系統設計中的核心。在微服務架構中，各個服務之間的通信可以分為同步和異步兩類。同步通信通常用於即時的請求和回應，而異步通信則允許服務之間解耦，適合處理高並發和延遲容忍的場景。在實踐中，我們常常依賴 API Gateway、Service Mesh 等工具來進行同步通信管理，而 RabbitMQ 等消息隊列則是典型的異步通信解決方案。接下來的部分，我將介紹如何結合 VPC 和 Load Balancer 的實作，來保護 GenAI generator 服務免受外部攻擊，同時確保內部通信的高效性和安全性。

實作教學：如何利用 VPC 和 Load Balancer 保護 GenAI 服務

以下以 GCP 服務為例說明。

建立 VPC 並將 generator 服務加入其中
- 確保 generator 服務只能在內部網絡中運行，並限制外部對其存取。
- 步驟：
  1. 在 GCP 管理平台中，進入 generator 服務所屬的 Cloud Run。
  2. 選擇 Edit & Deploy Revision，進入服務配置頁面。
  3. 進入 Networking 標籤頁，勾選 Connect to a VPC for outbound traffic，選擇事先設置的 VPC。
  4. 確保 VPC 隔離了該服務，避免外部無授權請求對其進行存取。
    這樣，外部流量將無法直接訪問 generator 服務，僅允許內部網絡中的其他微服務通過授權方式連接該服務。
設置 Reserved Proxy-Only Subnets
- 為 Load Balancer 設置專用的子網，從而管理內部流量並保護 generator 服務不被外部濫用。
- 步驟：
  1. 在 VPC 設置中，創建子網並選擇 Reserved proxy-only subnets for load balancing。
  2. 確保子網和 generator 服務位於相同的地區，以便負載均衡器能夠正確分發流量。
將 generator 服務設置為 Internal 模式
- 僅允許內部服務通過 VPC 連接 generator 服務，阻止來自外部的未授權存取。
- 步驟：
  1. 在 generator 服務的 Cloud Run 介面，找到 Ingress Control。
  2. 將 Ingress 設置為 Internal，確保該服務只能通過內部 VPC 連接，防止外部網絡的攻擊者發送惡意請求來消耗 token。
使用 Load Balancer 將合法請求路由至 generator 服務
- 使用 Load Balancer 來管理合法流量，並將來自前端應用的請求路由到內部的 generator 服務。
- 步驟：
  1. 在 GCP 中創建一個新的負載均衡器，選擇 Application Load Balancer 並將類型設置為 Internal。
  2. 設定負載均衡的 Backend，選擇 Serverless network endpoint group (Cloud Run) 作為後端服務，並指定 generator 服務。
  3. 配置 VPC 子網，並將內部授權的請求引導到 generator，以保證僅合法的流量可以進入該服務。

測試 generator 服務的內部訪問

通過負載均衡器進行內部訪問，並測試系統是否正確工作。

步驟：

使用 curl 測試內部流量是否能夠正確連接到 generator 服務：

curl -H "Host: generator-release-efzli6hwua-de.a.run.app" \
http://<hostname>:<port>/generate-text

發送 POST 請求，測試文本生成 API，並驗證 token 是否被正常消耗：

curl -i -X POST \
-H "Host: generator-release-efzli6hwua-de.a.run.app" \
-H "Content-Type: application/json" \
-d '{"prompt": "生成一段關於未來科技的描述"}' \
http://<hostname>:<port>/generate-text

通過這樣的架構設計，我們能夠在保護 generator 服務免受外部攻擊的同時，確保合法請求仍然能夠正常運行，防止惡意請求濫用 API token 或造成服務崩潰。這樣的安全措施對於任何涉及高資源消耗的 GenAI 服務來說，都是很重要的。負載均衡器與 VPC 的結合，不僅提升了內部微服務之間的安全通信，也保證了系統的高效性和穩定性。

ref.