iT邦幫忙

2025 iThome 鐵人賽

DAY 5
0
自我挑戰組

30 天做出零售 Mini-CDP:我的雲端事件、分群與行銷名單實作之旅系列 第 5

第 05 天:把「資料品質稽核清單」寫好,日更前先用這張小抄

  • 分享至 

  • xImage
  •  

我把每天 10 分鐘就能做完的資料檢查定下來。目標很單純:在看板與名單產出前,先確認資料能信,避免隔天還在解釋「為什麼數字怪」。

我今天定的「每日檢查 10 分鐘小抄」

每日檢查小抄 (T-1 24:00 結算,+08:00)

  • [ ] 檔案到齊:事件檔、名單檔是否都到 T-1?
  • [ ] 筆數變化:事件總筆數 vs 昨日 ±30% 以內?
  • [ ] 缺值率:member_id / event_time 缺值 < 1%?
  • [ ] 重複率:同 (member_id, event_name, event_time) 重複 < 0.5%?
  • [ ] 時間戳:未來時間(> 今天)= 0?跨日反向(支付早於下單)= 0?
  • [ ] 金額合理:amount < 0 筆數 = 0?currency 只有 TWD?
  • [ ] 金額平衡:GMV_net ≈ 毛GMV − 折抵 − 退款(誤差 < 3%)
  • [ ] 分佈異常:單日 AOV、支付成功率 介於近 14 日平均 ±20%?
  • [ ] 留存母體:new_customers > 0?D7/D30 有效母體 > 50?
  • [ ] 券流檢查:coupon_issued ≥ coupon_redeemed(當日)

原則:先抓明顯錯(到齊、缺值、重複、時間戳),再看趨勢(±20~30%)。有異常先標記,不急著找犯人,先凍結發布避免誤導。

我今天定的「異常警戒線 」(之後再調)
• 筆數變化:±30%
• 缺值率(member_id / event_time):<1%
• 重複率(同鍵):<0.5%
• 金額平衡誤差:<3%
• 成功率/AOV 波動:±20%(對比近 14 日平均)

我想要留痕跡,所以做了「稽核紀錄表頭」

CSV 表頭(可直接複製)

check_date,check_item,status,detail,sample_ids,spec_version,operator

我先寫了兩行假資料(方便之後追溯)

2025-09-17,missing_event_time,Y,"缺值0.4%(42/10500)","-",v1,edward
2025-09-17,gmv_balance,N,"誤差3.8% 超出門檻","order:O20250916xxx",v1,edward

status:Y=通過、N=不通過;detail 寫百分比或差額,sample_ids 放 1–2 個追查線索就好。

我今天做的三個決定
• 日更先過稽核才發布:任何一條紅燈(N)→ 暫緩對外看板/名單,先註記原因與 ETA。
• 門檻先粗後細:第一版能擋大雷就好,等穩定一週再把警戒線收緊。
• 每次修改都升 spec_version:避免同一天不同人用不同口徑。

我也寫了「故障時先做什麼」(迷你 Runbook)

Mini Runbook

  1. 標記:把對外看板加註「資料檢查中」,暫停對外匯出名單。
  2. 縮圈:先確認「到齊、缺值、重複、時間戳」四項。
  3. 定位:用 sample_ids 反查來源系統(POS/Payment/Survey)。
  4. 記錄:在稽核紀錄表補齊 root cause / workaround / next-step。
  5. 恢復:數據回正後,補一版「修正版」並升 spec_version。

小結:我今天把「資料能信」這件事用 checklist 固定下來。明天我會把這套檢查,對齊到「分群與名單」—也就是名單品質檢查 (覆蓋率、重疊率、黑名單與同意狀態)。

明日預告(Day 6):名單品質檢查 :覆蓋率、去重與黑名單;以及「重跑結果一致性」的檢查法。


上一篇
第 04 天:我把「指標字典」寫清楚,日更看板就看這些
系列文
30 天做出零售 Mini-CDP:我的雲端事件、分群與行銷名單實作之旅5
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言