Day 28｜Agent Design - Context - 用DSPy提高System Prompt的可維護性(4/5) - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2025 iThome 鐵人賽

DAY 28

自我挑戰組

從讀書筆記到可落地 AI：LangChain、LangSmith 與 Agent 工具 30 講系列第 28 篇

Day 28｜Agent Design - Context - 用DSPy提高System Prompt的可維護性(4/5)

17th鐵人賽

Vivianou

2025-10-12 23:58:08

89 瀏覽

分享至

目標先講清楚：
Drew Breunig怎麼做到將一大串的system prompt使用DSPy去結構化，提高system prompt維護性

DSPy可以做到什麼？

在 Day 10 提到：「長而清楚的結構化提示」雖然能提高表現，但Drew Breunig提到這樣的長字串可讀性、可維護性、跨模型可攜性都很糟。
Drew Breunig 分析了 OpenAI SWE-Bench 的 prompt 組成：

並示範用 DSPy 把「字串中的結構與規則」抽回程式模組管理。核心思路是：

Part 1.: 把任務、輸入/輸出與格式(Task, Instructions, Formating Instructions)，從一大段字串 prompt 中抽出來，轉換成DSPy的 Signature 與 Module 裡。
Part 2.: 用 MIPROv2 以評測資料自動優化指令(Detailed Context & Instructions)，並支援換模型後的再優化

Part 1．把任務、輸入/輸出與格式變成「Signature + Module」

理念：DSPY提供許多Module(挖空的Prompt template)，使用者只需要專注在輸入、輸出的結構跟「描述」處理邏輯

流程

範例（以 Place Match 為例）

目的：要判斷 place_one 與 place_two 是否同一地點，並給出信心等級。

Step 1. 定義 Signature-輸入/輸出/任務 -> PlaceMatcher(dspy.Signature)
Step 2. 選擇 Module-predict，將Signature帶入模板化的Prompt -> dspy. Predict (PlaceMatcher)

Part 2．用 MIPROv2 自動優化指令（可重跑以適配新模型）

理念：

當你有了穩定的 Signature/Module 後，並且已經設計好驗證的資料集（D26、D27的方式），使用DSPy的優化器-MIPROv2，可以讓模型用 eval data（驗證資料集）產生包含few-shot的指令。
只要換掉模型，重跑一次優化，就能得到適配新模型的最佳 prompt（因為會使用驗證資料跑新的Prompt的測試），不必手調長字串。

流程

範例

你有一批標註好的 place-match 範例(trainset)與指標(matcher)。
定義:
- prompt_model：產生指令候選（寫 prompt 的「作者」）
- task_model：執行任務與優化（實際跑任務的「選手」）
MIPROv2 會先從trainset中引導 few-shot 候選（輸出正確的樣本會被保留）。
它用資料摘要、程式摘要與隨機提示技巧，生成多個指令候選。
在驗證集上做多輪 prompt bake-off（小批量評測 + 週期性完整評測），以 貝葉斯優化找出最佳「指令 × few-shot」組合。
需要換模型時，只要改成新模型，重跑優化即可得到新贏家。

輸出的結果

# example output
artifact = {
  "signature": "PlaceMatcher",
  "instruction": """
Given two records representing places or businesses—each with at least a name and address—analyze...
(這裡是一大段經過優化的指令文字，約數百 tokens)
""",
  "few_shot_examples": [
    {
      "inputs": {
        "place_one": {"name": "Peachtree Café", "address": "123 Peachtree St NE, Atlanta"},
        "place_two": {"name": "Peach Tree Coffee & Cafe", "address": "125 Peachtree Street NE, Atlanta"}
      },
      "gold_output": {"match": True, "match_confidence": "medium"}
    },
    {
      "inputs": { ... },
      "gold_output": { ... }
    }
  ],
  "settings": {
    "task_model": "gpt-4o-mini@2025-xx-xx",
    "prompt_model": "gpt-4o@2025-xx-xx",
    "search/trials": 48,
    "metric": "F1_place_match"
  }
}

# 假設框架提供 save/load（名稱依版本）
dspy.save(matcher_opt, "place_matcher_opt.json")
# 之後可：
matcher_opt = dspy.load("place_matcher_opt.json")