iT邦幫忙

2022 iThome 鐵人賽

DAY 21
1
IT管理

2B or not 2B: B2B產品經理的學習筆記系列 第 21

產品品質4: Google教你掌控軟體服務的品質可靠度!

  • 分享至 

  • xImage
  •  

俗話說的好,打不贏Google,就加入他(!?)
什麼!加入不了?那至少可以學學他吧~Google這麼強大,背後一定有很多Know how是我們可以參考的。

這樣的心聲,Google聽到了!因此Google在2017年線上發表了SRE Book,分享了對於Site Reliability這件事他們所建構的監控和警報系統的基本原則和實踐方法。其中,產品經理最常廣泛討論的莫過於Google的4個黃金信號,就讓我們跟著Google 學學大前輩是如何看待這件事的吧!

用監控來確認軟體服務正常運作

前面幾篇文章闡述了許多要確認軟體服務運行順不順暢的目的,為求品質不出異常,我們會透過監控來確認諸多可能。

其中包含但不限於:

分析長期趨勢

ex: 我的Database有多大,資料增長速度有多快?我的每日活躍用戶數增長速度有多快?

AB Testing

ex: 優化後的程式是否有讓查詢變得更快?網站是否比上週還慢?

Alert

ex: Database使用度已高達95%,需要立刻清掉一些資料!某個服務壞了,需要有人修理!

Trace back

我們的延遲剛剛猛增;大約在同一時間還發生了什麼?連續兩個週末服務都有斷線又重啟的狀況,當時有跑什麼job嗎?

構建Dashboard

如我司,利用Grafana的Dashboard監控各種服務的上述問題,如以下示意圖:

而這樣的監控工具通常亦可包括SRE Book中提到的四個使用者體驗相關的黃金信號Golden Signals,至於是哪四個,請待我們下回分解:產品品質5: Google分享的4個軟體服務運行黃金信號


上一篇
產品品質3: 用HEART框架衡量產品UX表現
下一篇
產品品質5: Google分享的4個軟體服務運行黃金信號
系列文
2B or not 2B: B2B產品經理的學習筆記30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言