去頭去尾、補中間，再回頭砍頭尾：把讀法律判決書的邏輯，接上 AI Data 的數據解讀管線

17th鐵人賽

147 瀏覽

TL;DR (EN→ZH)
Focus on the reasoning core (ratio decidendi) first, then align facts and outcomes to that core. → 先抓「中間的論證」這個核心，再回頭檢核事實與結果是否一致。

0) 為什麼要把「讀判決」跟「AI Data」綁在一起？

口訣：去頭 → 去尾 → 補中間 → 回頭砍頭尾（循環）

去頭（Facts 去雜）
- 法律：先暫時「淡化」具體細節與情緒性描述，避免被偶然事實牽著走。
- AI：建立資料字典與特徵黑白名單，先屏蔽洩漏性特徵（例如：包含最後判決詞彙的段落、當事人姓名等），避免模型「偷看答案」。
去尾（Outcome 去惑）
- 法律：先不看「誰贏誰輸」，不被結局框架效應影響。
- AI：把「標籤欄」隔離；先做無監督探索（聚類、主題模型）理解論證結構，再談監督式預測。
補中間（Reasoning 補齊）
- 法律：抓出判決理由（ratio decidendi）、可遷移的「規則/測試/三段論證」。
- AI：把「理由」變成可計算特徵（例如：自由/福祉/德性三維度；比例測試、利益衡量、嚴格審查等），並用可解釋模型或 LLM-Chain 萃取與對照。
回頭砍頭尾（Consistency 校驗）
- 法律：用中間原則重新審視「頭與尾」，檢查是否一致、是否有例外條件。
- AI：用對比評估與一致性測試檢查：
  - 若改變部分事實（counterfactual），結論是否合理變動？
  - 若遮蔽判決結果詞，模型輸出是否仍穩定？
  - 若換資料年份／轄區，規則是否可遷移？

形成螺旋式精煉：每次循環都讓「理由表徵」更清晰，資料管線更乾淨，模型更可靠。

法律元素	讀判決的任務	AI 對應任務	具體做法（例）
Facts（頭）	去雜訊、去情緒	去洩漏、標準化	文本清洗、遮蓋姓名/案號、時間正規化
Holding（尾）	暫置結局	標籤隔離	訓練前不暴露 outcome 給特徵工程
Ratio（中間）	抽出可遷移原則	原則特徵化	自由/福祉/德性指標、比例/嚴格審查標籤
Tests/Rules	建立可複用測試	可機讀規則	以結構化 JSON 呈現要件與例外
Dissent/Concurring	找分歧點	多視角 embedding	以多向量空間存不同意見對應向量
Standard of Review	審查強度	權重/閾值	在推理引擎中調整權重與信心需求
Policy Considerations	公共利益考量	社會損益特徵	加入成本/風險/外部性估計欄位

步驟 A：資料進場與清洗

步驟 B：補中間（論證向量化）

主題建模 or LLM 標註：抽取「自由/福祉/德性」、審查標準、三段論法元素。
結構化規則：把要件與例外落為 JSON（例：necessity, proportionality, less-restrictive-alternative）。
因果素描：以 DAG/temporal order 粗描可能的因果鏈，避免把結果當原因。

步驟 C：監督式學習（可解釋優先）

步驟 D：回頭砍頭尾（一致性與健壯性）

（說明：以下是「一步一步做」的概念步驟，你可用 Python/JS/R 皆可實作）

Step 1：載入與遮蔽

Step 2：中間論證抽取

Step 3：結構化

轉成 JSON：
- issues: [...]
- rules_tests: [{name, elements_required, exceptions, std_of_review}]
- reasoning_axes: {freedom, welfare, virtue}

Step 4：可解釋模型

Step 5：一致性回檢

（範例純為示意，請替換為你的實際文本）

事實摘要（去頭版）：
- 存在有償合意（自由+）
- 可能資訊不對等/經濟誘因（自由-）
- 涉及人性尊嚴/不可商品化之爭議（德性+）
- 涉及未成年人最佳利益（福祉+）
中間論證 → 向量化：
- freedom = 0.45（合意存在但被污染）
- virtue = 0.85（強烈尊嚴疑慮）
- welfare = 0.70（最佳利益考量重要）
擬議規則（JSON示意）：
{
"rule": "契約自由受德性與最佳利益限制",
"tests": [
{"name": "tainted_consent", "elements": ["info_asymmetry", "economic_coercion"]},
{"name": "best_interest_child", "elements": ["stability", "care_capacity"]}
],
"std_of_review": "proportionality"
}
模型可解釋觀察：
- SHAP 顯示 virtue 與 best_interest_child 權重最高 → 與法官書面推理一致
- 當把 economic_coercion 設為 0（反事實），自由指標上升，模型擬判也更接近維持契約