iT邦幫忙

鐵人檔案

2021 iThome 鐵人賽
回列表
DevOps

這個 site 就是遜啦 - SRE 30 天登大人之旅 系列

學渣做完專題之後被維運問題搞到懷疑人生,於是決定閱讀 google 的 SRE book 精進自己,並幫專題登大人,順便記錄下這段時間閱讀的收穫。

鐵人鍊成 | 共 30 篇文章 | 26 人訂閱 訂閱系列文 RSS系列文 團隊NTNU-Unic0rn
DAY 11

Day 11:架設 Grafana (0)

做好了指標的收集,接下來還有一個很重要的步驟 --- 數據的視覺化,關於這方面的功能雖然 Prometheus 已經有內建簡單的圖表了,然而在實際運行的服務上它...

2021-09-25 ‧ 由 bogay 分享
DAY 12

Day 12:Commitizen

話說今天本來是打算要接著昨天的進度紀錄架設 grafana 的 dashboard,可是昨天半夜 debug 到一半突然發現,今天不是 PyCon sprint...

2021-09-26 ‧ 由 bogay 分享
DAY 13

Day 13:架設 Grafana (1)

那麼今天再回來繼續處理我們的 dashboard 吧,上次雖然找到了這個 caddy 的 dashboard,不過卻發現它沒有辦法顯示資料。 檢查 panel...

2021-09-27 ‧ 由 bogay 分享
DAY 14

Day 14:Load testing

雖然在昨天有說到今天希望可以改善 dashboard,然而我在做到一半的時候突然驚覺...現在根本就沒有多少資料可以給我畫圖表。但是在這種情況下,如果我每次都要...

2021-09-28 ‧ 由 bogay 分享
DAY 15

Day 15:目前 NOJ 的部署流程

本來今天是要講完 Grafana 的部分,不過我發現我還是來不及做完...目前的進度只有下面這樣,我認為還缺了點東西,看看明天能不能處理完吧。 所以今天我想來...

2021-09-29 ‧ 由 bogay 分享
DAY 16

Day 16:架設 Grafana (2)

看來今天終於是可以把 Grafana 的章節結束掉了,之前提到我覺得目前找到的 dashboard 不大符合我的需求,所以要來改造一下。 原本的問題 先來講講本...

2021-09-30 ‧ 由 bogay 分享
DAY 17

Day 17:Docker 的機敏資料管理

記得在第十五天的時候我有提過,目前 NOJ 有其中一個問題是我們會把一些機敏資料,像是 JWT 使用的 secret、沙盒的 token 等等放在 docker...

2021-10-01 ‧ 由 bogay 分享
DAY 18

Day 18:淺談軟體測試

經過了差不多兩週,我認為監控和警報的部分總算是告了個段落,雖然之後還需要透過實際的收集監控資料來修正警報的規則跟 dashboard 就是了。接下來剛好我是讀到...

2021-10-02 ‧ 由 bogay 分享
DAY 19

Day 19:處理系統超載

讀完軟體測試之後,接下來讀到一個比較有幫助的章節是如何處理系統超載,書中提供了一些可供參考的策略。撇除那些針對大型分散式系統的部分,我想整理一下對於我們這種小型...

2021-10-03 ‧ 由 bogay 分享
DAY 20

Day 20:如何撰寫測試

今天就書中描述與我個人的開發經驗,來談談該如何撰寫測試吧。有時候我們可能會遇到,軟體在開發之初並沒有做測試的打算,可能有各種原因,包括時程的壓力、只是想快速驗證...

2021-10-04 ‧ 由 bogay 分享