iT邦幫忙

2025 iThome 鐵人賽

DAY 16
0
Software Development

AI 慣老闆的 AI 學習歷程 - AI 時代的軟體工程的反思系列 第 16

AI 慣老闆的 AI學習日記 Day 15 - 幻覺?假資料:客戶說數字不對!

  • 分享至 

  • xImage
  •  

https://ithelp.ithome.com.tw/upload/images/20250818/20142509B6v87q2dNl.png

貝老闆(端著拿鐵衝進來):「我讓 AI 實習生做『月營收戰報』,圖表美到客戶跪下!」

小可(瞳孔地震):「客戶剛打來說數字不對……跪下的是我。」

貝老闆:「不就把資料交給 AI 摳一摳?」

小可(抖手拿出摺扇):「你給的是上週 Demo 的 CSV,加上昨天 GA 取樣,還跨時區。AI 竟然自己『合理補齊』?通通都是假的資料...」

貝老闆(愣):「不是說生成式很聰明?」

小可:「它是作家,不是會計,你沒給他資料他就編出來給你....」

(電話響)

好威:「先別吵。這叫 LLM 幻覺。缺資料時它會把故事編圓。Grounding 就是要它『先取數、再說話』:Source → Compute → Explain。讓 LLM 當解說員,不是出納。」

好威解析

1)你要的報表其實是兩件事:算對數字說明背後的原因。前者要靠 SQL/API 真查、真聚合;後者才交給 LLM。把兩件事混在同一個「生成」步驟,等於請脫口秀演員幫你結帳,每次都要自己好好確認資料的來源,是否真的有跟 API 和 DB 連動。

2)報表要能對帳:列出資料來源、時間區間、幣別與時區、行數與範例列、查詢版本。沒有這些,漂亮的圖就是漂亮的幻覺。

概念拆解

1️⃣ 幻覺與信度控制
LLM 幻覺常源於提示含糊、缺乏工具與資料邊界。像本案,它把 Demo 檔與取樣資料拼一起,再用語意猜測「合理趨勢」。降幻覺的關鍵是把 不確定性顯性化:降低 temperature、要求『若資料不足請回覆 Unknown』、給出負面指令『禁止自創數字』、要它 標示引用信心說明,並用 few‑shot 示範「缺資料就停」的回覆格式。

2️⃣ Grounding 流程與護欄
Grounding = 以真資料為根。步驟:
A. 先用 Tool/RAG 列出可用來源(DB、GA、金流、Excel);
B. 由程式或 SQL 完成聚合與校驗;
C. 交給 LLM 只做摘要與敘事。
護欄包括:固定 JSON Schema、產出 row_count/時間範圍/currency/timezone、顯示查詢摘要與 checksum、對齊發票與金流三方;再用 Great Expectations/dbt tests 做欄位型別、空值與閾值檢查。最後把「數字表」與「解說文」分開輸出。

Takeaways

A. 對帳儀式
每份報表強制雙軌輸出:
數字表=由程式計算的明細與彙總;
解說文=由 LLM 生成的口語摘要。
頁首固定放:來源清單、查詢時間、版本與 commit、樣本列、三數對帳(訂單數/發票金額/金流入帳)。若任一差異 > 0.5%,停止發布,回報缺口,不得「估」。

B. 老闆級 Prompt 模板)
「請先列出我可用的資料來源清單與時間區間;用 SQL/API 計算下列指標:GMV、退款率、ARPU。輸出 JSON{metrics, sources, query, sample_rows, timezone, currency}。若資料不足或來源衝突,請停止生成解說,改回覆『缺資料清單』與取得方式。最後再依 JSON 生成 200 字摘要,並附『對帳表』與『風險提示』。」——這段讓不懂技術的人,也能要求 Grounded 報表。

**C. 小團隊流程 **
為報表寫微型 PRD 與 AC:口徑定義、誤差閾值、UAT 樣本、Rollback。建立 report-ci:跑資料測試、產物簽名、上線前對帳。失敗就自動回退前版,並發 Slack 通知。

精煉重點

  • 先取數再說話;數字歸程式,故事給 LLM
  • 沒有對帳,就沒有真相;沒有來源,圖再美也是幻覺。

今日提問

你的團隊目前最常被問的『指標口徑』是哪一個?它的資料來源、時間區間與時區定義清楚嗎?

小作業 Prompt

把你的一個指標貼給 AI,直接用這段模板啟動 Grounding:

「請列出可用資料來源與區間;以 SQL/API 計算【自選指標】並輸出 JSON(含 metrics/sources/query/sample_rows/timezone/currency)。不足則回覆缺口與取得方式;最後依 JSON 生成 150–200 字商務摘要與對帳表。」


上一篇
AI 慣老闆的 AI學習日記 Day 14 假日促銷功能臨時插單——「再順便加一下!」
下一篇
AI 慣老闆的 AI學習日記 Day 16 - 團隊擴編多人同改 Replit 專案「誰又把我的改動覆蓋了?」
系列文
AI 慣老闆的 AI 學習歷程 - AI 時代的軟體工程的反思32
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言