在日常運作中,會遇到不同類型的錯誤,如何從徵狀查找到源頭,以確切迅速的處理為管理的重要關鍵
服務錯誤
情境:使用者無法存取服務,從頭開始檢查到尾
是否能連...
昨天最後有提到,由於沒有備份重要的 Secrets,導致重新部署 GitLab 後,因為 PostgreSQL 無法連線,導致無法正常運作。我是覺得應該有些方法...
前篇提問
常見的監控指標和 PromQL
Prometheus Server 的讀寫流程
本篇要來講述 Prometheus Server 的寫入流程。先以...
雲端架構 UAT 環境部署完後,原本想要測試 image 部署上去是否正常,但由於資料庫還是空的,會沒辦法正常,所以必須要在 UAT 環境連線 Staging...
在協助 DS 完成 CICD 部署的過程中,為了確保環境跟 lib 一致,我們有使用 pipreqs,他會自動掃整份 folder 看 python 有什麼相依...