iT邦幫忙

鐵人檔案

2021 iThome 鐵人賽
回列表
DevOps

Dev's Ops 啟程 系列

今年來跟各位分享SRE從零到有, BDD, CI/CD Tools 分享, ChatOps 運用, Tool實作 with golang 之經驗。

鐵人鍊成 | 共 30 篇文章 | 14 人訂閱 訂閱系列文 RSS系列文 團隊神龍特攻隊 - it 宏的逆襲
DAY 1

[Day 1] Dev's Ops 啟程前言

啟程 哈囉 各位Ithome的大家,今年的鐵人賽又見面拉~今年要來跟大家分享在當個純Dev後,因工作分配接下來當也要負責Ops,當中的轉變的經驗,還有在我職涯經...

2021-09-09 ‧ 由 rainforest 分享
DAY 2

[Day 2] SRE - 你的服務死後不要讓人擔心嘛

graceful shutdown 在關閉服務前,在服務內部以做完該做的事情,使得服務得以善終。在容器化的時代,現在的部署更新,幾乎都是透過image版本更新的...

2021-09-10 ‧ 由 rainforest 分享
DAY 3

[Day 3] SRE - Log寫好一點,對團隊好一些

LogSeverity 有在寫Log的人都知道Log需要被分級,而分級對於問題的除錯,是很重要的,當問題發生時可以幫助工程師快速定位。 相信在寫go的人都對lo...

2021-09-11 ‧ 由 rainforest 分享
DAY 4

[Day 4] SRE - 保持精簡的監控

監控 今天來介紹監控的四個黃金訊號、如何簡化以及如何維護。 四個黃金訊號 延遲 流量 錯誤 飽和度 延遲 請求的結果分兩種成功的請求與失敗的請求「慢」的錯比...

2021-09-12 ‧ 由 rainforest 分享
DAY 5

[Day 5] SRE - 發動測試左移之術,預視未來的機制

測試左移(Shift Left Testing ) 如何事件左移 事先演練未來排定作業 因為團隊會在每週固定時間進行週會,而這個技巧我常常會在週會後,看著未來的...

2021-09-13 ‧ 由 rainforest 分享
DAY 6

[Day 6] SRE - 起身對抗活在警報中的惡魔

警報疲乏 相信大家都聽過「放羊的孩子」的伊索寓言故事。 今天我們探討的問題是當團隊中的警報器常常發生不是「真正的警報」而是「假警報」時,會導致大家對於警報的警覺...

2021-09-14 ‧ 由 rainforest 分享
DAY 7

[Day 7] SRE - 故障排除小技巧

故障排除小技巧 通常故障排除的流程如下圖 常見的陷阱 誤解故障的現象,扭曲現象的含義,只會浪費時間追問題。 簡單來說就是沒有按照SOP流程執行,漏掉某些步驟以...

2021-09-15 ‧ 由 rainforest 分享
DAY 8

[Day 8] SRE - 火炎焱燚之保衛戰

火燒起來怎麼辦? 當你聽到手機有叮咚叮咚,一連串的alert表示服務已無法繼續服務,幾分鐘後電話來了,通報案件後,你該如何是好? 先保持冷靜 保持冷靜,避免過...

2021-09-16 ‧ 由 rainforest 分享
DAY 9

[Day 9] SRE - 自動化

自動化 什麼東西可以自動化?對我而言只要可以列出SOP的事情,都可以實現自動化。 價值 一致性 當不同人遇到同樣的事件,處理的方法可能有百百種,但不一定每個人處...

2021-09-17 ‧ 由 rainforest 分享
DAY 10

[Day 10] SRE - ON-CALL

ON-CALL 今天為大家介紹ON-CALL常見的須注意之事項 建立心態 我為人人,人人為我,今天你幫大家解決問題,大家之後也會在你不便之時幫助你,以我們te...

2021-09-18 ‧ 由 rainforest 分享