學渣做完專題之後被維運問題搞到懷疑人生,於是決定閱讀 google 的 SRE book 精進自己,並幫專題登大人,順便記錄下這段時間閱讀的收穫。
做好了指標的收集,接下來還有一個很重要的步驟 --- 數據的視覺化,關於這方面的功能雖然 Prometheus 已經有內建簡單的圖表了,然而在實際運行的服務上它...
話說今天本來是打算要接著昨天的進度紀錄架設 grafana 的 dashboard,可是昨天半夜 debug 到一半突然發現,今天不是 PyCon sprint...
那麼今天再回來繼續處理我們的 dashboard 吧,上次雖然找到了這個 caddy 的 dashboard,不過卻發現它沒有辦法顯示資料。 檢查 panel...
雖然在昨天有說到今天希望可以改善 dashboard,然而我在做到一半的時候突然驚覺...現在根本就沒有多少資料可以給我畫圖表。但是在這種情況下,如果我每次都要...
本來今天是要講完 Grafana 的部分,不過我發現我還是來不及做完...目前的進度只有下面這樣,我認為還缺了點東西,看看明天能不能處理完吧。 所以今天我想來...
看來今天終於是可以把 Grafana 的章節結束掉了,之前提到我覺得目前找到的 dashboard 不大符合我的需求,所以要來改造一下。 原本的問題 先來講講本...
記得在第十五天的時候我有提過,目前 NOJ 有其中一個問題是我們會把一些機敏資料,像是 JWT 使用的 secret、沙盒的 token 等等放在 docker...
經過了差不多兩週,我認為監控和警報的部分總算是告了個段落,雖然之後還需要透過實際的收集監控資料來修正警報的規則跟 dashboard 就是了。接下來剛好我是讀到...
讀完軟體測試之後,接下來讀到一個比較有幫助的章節是如何處理系統超載,書中提供了一些可供參考的策略。撇除那些針對大型分散式系統的部分,我想整理一下對於我們這種小型...
今天就書中描述與我個人的開發經驗,來談談該如何撰寫測試吧。有時候我們可能會遇到,軟體在開發之初並沒有做測試的打算,可能有各種原因,包括時程的壓力、只是想快速驗證...