今天是中秋連假的最後一天!收拾心情明天準備上班拉!這裡是今天讀的原文出處:The Production Environment at Google, from the Viewpoint of an SRE,那我們就開始吧!
除了前天三天提到的內容:
還有一些重要的運行組件:像是鎖服務(Lock Service) 或是監控系統:
第一個是鎖服務(Lock Service),Borg 使用鎖服務的原因主要有兩點:
第二個是監控和警報系統,也是服務維運的關鍵。Borgmon 監控程序在數據中心中運行,定期獲取監控對象的監控行為。這些監控指標可用於觸發警報,或存儲供以後查看。監控系統的主要應用包括報告真實問題,比較服務更新前後的狀態變化,以及查看資源使用量的時間變化,這對於制定資源計劃非常有用。在維護和運行服務時,分布式鎖服務和監控系統都起著至關重要的作用。
今天瞭解了其他在 Borg 中同樣重要的組件系統,後面會更深入講解 Borg 監控系統的部分,那接著就來看軟體的基礎設施,那就明天見囉!掰噗!