iT邦幫忙

2021 iThome 鐵人賽

DAY 13
0
DevOps

Dev's Ops 啟程系列 第 13

[Day 13] SRE - 悟

關於身為SRE團隊的心得

關於SRE的系列終於分享完囉~所以講一下SRE從零星到有概念後的心得,以下是關於團隊,個人覺得關於系統的維運面的心得

成員信心提高

大家經過事件演練的洗禮,至少知道如何快速反應,即時止血。


成員壓力下降

自動化及精簡的監控幫助大家做了很多既定流程,利用警報疲乏文章的技巧持續跟惡魔對抗,讓大家的作息正常帶來了很多好處大家壓力也不再那麼緊繃。


解決問題效率提高

熟能生巧,大家常常透過定期演練計畫模擬看不到的敵人,當敵人一出現自然而然的就知奧怎麼快速對抗它。


反應時間提升

一樣是警報疲乏對抗之後的效果之一,大家對於警報不再冷漠,而是一聽到即刻準備作戰!


團隊內氣氛更佳

大家討論事件如何解決,每個人觀點會不一樣,帶來的經驗與學習效果非常顯著。


降低警報疲乏

每個人對於警報不再冷感,當每個警報都有意義時,你去看他才有意義。


檢討文化,建立成功

人人為我,我為人人,每次的檢討都作為成長的經驗,每次的檢討是為了團隊的系統能更好。


降低對於專案開發的干擾

在平常開發時,不會被莫名其妙的事件影響到專案開發的進度,幾乎每個人能專注於開發提高生產效率。


小結論

關於SRE,我想就是「想盡辦法讓服務更穩定」,最後重點就在於『人』的培養與訓練,以及面對問題的觀念,在第二天到第十二天的SRE分享文章有提供大家概念及技巧,這些都是大家用經驗堆出來的。

題外話,話說今年中秋節大家都怎麼過呢?

我的話是...吃月餅配鐵人賽XDD/images/emoticon/emoticon61.gif


上一篇
[Day 12] SRE - 定期演練計畫
下一篇
[Day 14] 關於 SRE 與 SEC 的關係
系列文
Dev's Ops 啟程30

1 則留言

0

還沒買月餅,倒是有吃到烤肉@@

我要留言

立即登入留言