iT邦幫忙

2023 iThome 鐵人賽

DAY 7
1

Availability

衡量服務運行時間的指標,通常以百分比表示,代表服務不中斷運行的時間。

  • 目標是實現高可用性,通常追求 99.99% 的可用性。
  • 高可用性確保服務隨時可用,減少停機時間。

Scalability

系統提升處理業務量的能力,通常有垂直擴展和水平擴展兩種方式。

  • 垂直擴展:增加單個 instance 的資源,如 CPU、記憶體。
  • 水平擴展:增加更多相同 instance,提高處理能力。

水平擴展通常更具成本效益且提高可用性,但是缺點是可能會需要增加額外的 infrastructure,例如:LB。

Live Migration

將正在運行的虛擬機器移動到其他物理機器的技術,以維護或升級物理機器。

  • 不能更改虛擬機器的配置。
  • 支援使用本地 SSD,但不支援 GPU 和 Preemptible instance。
  • 建議 Availability Policy 可以調整 on host maintenance 和 automatic restart。

GPU

處理圖形和運算密集型工作的硬體加速器。

  • 費用較為昂貴,需要謹慎使用。
  • 部分機器類型不支援 GPU。
  • 需要注意 on host maintenance 只有 terminate VM instance 的選項。
  • image 要支援 GPU library 才能使用 GPU。
  • 建議 Availability Policy 的 automatic restart 要打開,這樣出錯才會重啟。

Security

系統免受威脅和攻擊的關鍵。

  • 使用防火牆限制流量。
  • 儘量使用 Internal IP Addresses,減少風險。
  • 使用單一用戶節點 (Sole-Tenant Nodes) 進行資源隔離。
  • 使用客製化符合企業資安需求的 custom image 來建構 VM instance。

Resiliency

系統在部分故障時能夠保持運行,而不完全中斷。

  • 使用 Managed Instance Groups 和全球性負載均衡器實現 Resiliency。
  • 使用 Logging、Monitoring、Live Migration 和 Automatic Restart 確保高可用性。
  • 建立 Health Checks 和 Disaster Recovery 計劃。

上一篇
Day 06:Cloud Load Balancing
下一篇
Day 08:Cost
系列文
30天準備GCP Professional Cloud Architect30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言