關於SRE的系列終於分享完囉~所以講一下SRE從零星到有概念後的心得,以下是關於團隊,個人覺得關於系統的維運面的心得
大家經過事件演練的洗禮,至少知道如何快速反應,即時止血。
自動化及精簡的監控幫助大家做了很多既定流程,利用警報疲乏文章的技巧持續跟惡魔對抗,讓大家的作息正常帶來了很多好處大家壓力也不再那麼緊繃。
熟能生巧,大家常常透過定期演練計畫模擬看不到的敵人,當敵人一出現自然而然的就知奧怎麼快速對抗它。
一樣是警報疲乏對抗之後的效果之一,大家對於警報不再冷漠,而是一聽到即刻準備作戰!
大家討論事件如何解決,每個人觀點會不一樣,帶來的經驗與學習效果非常顯著。
每個人對於警報不再冷感,當每個警報都有意義時,你去看他才有意義。
人人為我,我為人人,每次的檢討都作為成長的經驗,每次的檢討是為了團隊的系統能更好。
在平常開發時,不會被莫名其妙的事件影響到專案開發的進度,幾乎每個人能專注於開發提高生產效率。
關於SRE,我想就是「想盡辦法讓服務更穩定」,最後重點就在於『人』的培養與訓練,以及面對問題的觀念,在第二天到第十二天的SRE分享文章有提供大家概念及技巧,這些都是大家用經驗堆出來的。
題外話,話說今年中秋節大家都怎麼過呢?
我的話是...吃月餅配鐵人賽XDD