我把每天 10 分鐘就能做完的資料檢查定下來。目標很單純:在看板與名單產出前,先確認資料能信,避免隔天還在解釋「為什麼數字怪」。
我今天定的「每日檢查 10 分鐘小抄」
原則:先抓明顯錯(到齊、缺值、重複、時間戳),再看趨勢(±20~30%)。有異常先標記,不急著找犯人,先凍結發布避免誤導。
我今天定的「異常警戒線 」(之後再調)
• 筆數變化:±30%
• 缺值率(member_id / event_time):<1%
• 重複率(同鍵):<0.5%
• 金額平衡誤差:<3%
• 成功率/AOV 波動:±20%(對比近 14 日平均)
我想要留痕跡,所以做了「稽核紀錄表頭」
CSV 表頭(可直接複製)
check_date,check_item,status,detail,sample_ids,spec_version,operator
我先寫了兩行假資料(方便之後追溯)
2025-09-17,missing_event_time,Y,"缺值0.4%(42/10500)","-",v1,edward
2025-09-17,gmv_balance,N,"誤差3.8% 超出門檻","order:O20250916xxx",v1,edward
status:Y=通過、N=不通過;detail 寫百分比或差額,sample_ids 放 1–2 個追查線索就好。
我今天做的三個決定
• 日更先過稽核才發布:任何一條紅燈(N)→ 暫緩對外看板/名單,先註記原因與 ETA。
• 門檻先粗後細:第一版能擋大雷就好,等穩定一週再把警戒線收緊。
• 每次修改都升 spec_version:避免同一天不同人用不同口徑。
我也寫了「故障時先做什麼」(迷你 Runbook)
小結:我今天把「資料能信」這件事用 checklist 固定下來。明天我會把這套檢查,對齊到「分群與名單」—也就是名單品質檢查 (覆蓋率、重疊率、黑名單與同意狀態)。
明日預告(Day 6):名單品質檢查 :覆蓋率、去重與黑名單;以及「重跑結果一致性」的檢查法。