iT邦幫忙

0

Day.21讀懂數字:怎麼看延遲/成功率

  • 分享至 

  • xImage
  •  

前言
昨天我已經讓 n8n 每天 07:00 自動存一列資料。從今天開始,不再只看有沒有存到,而是學會看懂這些數字:成功率、延遲、被限速的次數、資料新鮮度……有了讀法,就能在成果報告裡清楚回答「這個小服務穩不穩、慢不慢、什麼時候容易壞」。
一、先認識今天要看的 6 個數字
1.成功率(successRate)
成功回來而且內容正常的比例。老師最在意的「穩不穩」就是看這個。觀察法:日合計、逐小時趨勢都要看。
2.平均回應時間(avgLatencyMs)+P95(p95LatencyMs)
一次請求從送出到回來花多久;P95 是「95% 以內的請求比它更快」。平均看整體,P95 看「尾巴很慢」。
3.資料新鮮度(dataFreshnessSeconds)
畫面顯示時,距離 updateTime 已經過了幾秒。到站資訊「看起來準」的關鍵。
4.限速次數(tooManyRequestsCount / 429)
被對方回「太常查」的次數。若不為 0,查詢節奏或快取策略需要調整。
5.無資料次數(noDataCount)
來源正常,但這一站目前真的沒有到站資訊。不是錯誤,但太多會影響體感,要和「打不到」分開算。
6.請求量(totalRequests)
一段時間內打了幾次。用來找尖峰時段,對照延遲與 429 是否同時上升。
二、最低限度的門檻
•成功率(日)≥ 97%(若當天校網斷線,註記原因,不硬追數字)。
•P95 延遲 < 800 ms;平均延遲 < 400 ms(即時查詢感覺流暢)。
•資料新鮮度(ETA)平均 ≤ 20 s,P95 ≤ 30 s(對於公車 ETA,30 秒內多半可接受)。
•429 率 < 1%(429 次數 ÷ 總請求;一旦超過,先檢查快取/尖峰策略)。
•無資料比例:以站點為單位觀察(長期高於 20% 的站點,標記「班次稀疏」或檢查來源)。
以上門檻是學生專題可達的初版;後續可按實測調整。
三、圖要怎麼看(看圖說話的套路)
•折線圖(逐小時成功率):找「掉下去的谷底」。若 07:30–08:00 掉到 90%,回去看同時段的 429 與延遲。
•箱型/百分位圖(延遲):看尾巴。平均 300ms 但 P95 1500ms,代表偶發很慢,要查是不是某幾站或某時段。
•散佈或熱力(新鮮度 vs. 時段):看是否常超 30 秒。若上午常過 30 秒,尖峰策略要上場(Day 17)。
•長條(429 次數按時段):抓「節奏不對」的時段。最能說服需要快取/節流。
•堆疊(noData vs. error):把「真的沒車」與「打不到」分開。報告要清楚說:不是全都壞,是沒班次比較多。
四、遇到異常時的判讀步驟
•成功率低 → 先看錯誤類型:若多是 429,拉長 ETA 快取(個人 10–15s;看板 20–30s);若多是 5xx/連不上,照 Day 18 先給上一筆+標示時間並記錄重試。
•延遲高但成功率正常:若只在尖峰,啟用「系統先抓、畫面讀快取」;若全天都慢,來源偏慢或網路差,畫面強化「資料更新於 …」。
•新鮮度常 > 30s:可能是排程過久或被擋,調整抓取頻率與節流;若是單一站點,標記「資料波動」。
•noData 突然飆高:可能是維護或班次異常,顯示「官方資料暫不穩定」,不要當成系統錯誤。
六、小結
•觀測重點:成功率、延遲(含 P95)、資料新鮮度、429 次數、無資料次數、請求量。
•初版 SLO:日成功率 ≥97%、P95 延遲 <800ms、ETA 新鮮度 P95 ≤30s、429 率 <1%。
•讀圖套路:先看趨勢(逐小時)、再看尾巴(P95)、最後對時段(尖峰)。
•異常判讀照決策樹:先分 429/5xx,再決定「拉快取/讀快取/標示新鮮度/套用備援」。
•與 Day 17(快取)、Day 18(備援)、Day 19(指標欄位)互相對得起來。


圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言