提示工程是一種設計和優化輸入指令(Prompt)的藝術與科學。它是 LLM 時代的新編程方式,目的在於不改變模型權重(不微調)的前提下,最大化地激發模型的潛能。以下兩種策略是利用 LLM 上下文學習能力的基礎,決定了模型對任務格式和要求的適應程度。
「請將以下句子翻譯成英文:『我今天心情很好。』」
中文:我今天心情很好。
英文:I am in a good mood today.中文:明天可能會下雨。
英文:It might rain tomorrow.中文:我想去看電影。
英文:
當任務涉及多步驟推理、邏輯判斷或複雜計算時,我們需要引導模型**「思考」**。
CoT 是目前解鎖 LLM 複雜推理能力的最重要技術。
Prompt: 「如果小明有 5 個蘋果,他拿走 2 個,又從媽媽那裡得到 3 個。他現在有幾個蘋果?請逐步推理。」
Self-Consistency 是一種提高 CoT 答案可靠性的解碼與投票策略。
提示策略 | 核心操作 | 增強能力 | 適用情境 |
---|---|---|---|
Zero-shot | 只給指令。 | 依賴模型原有通用知識。 | 簡單、直接的常見任務。 |
Few-shot | 給予少量 I/O 範例。 | 讓模型學習特定格式/風格。 | 任務較複雜、需要對齊格式時。 |
CoT | 要求逐步思考。 | 提升邏輯推理、多步驟計算能力。 | 複雜計算、推理判斷題。 |
Self-consistency | 多次 CoT 後投票。 | 極大提高複雜任務最終答案的準確率。 | 需要高可靠度的推理任務。 |