Day 25 GPT ＆提示詞 -- 大型語言模型是怎麼「懂」你的？

2025 iThome 鐵人賽

DAY 25

AI & Data

ㄧ個八卦的時間也能了解AI最新趨勢系列第 25 篇

17th鐵人賽

王美珠

團隊美珠姨

2025-10-09 09:04:06

108 瀏覽

分享至

早安大家～昨天我們簡單介紹了transformer 架構，我們也有提到他和當今最流行的GPT 有很大的關聯。今天我們就來聊聊GPT還有prompt 的改念！

GPT

GPT 是 Generative Pre-trained Transformer (現在大家都講gpt 應該很少人知道他的全名吧xd)
他是由Open AI 所開發的大型語言模型（LLM），我想在這個世代的大家應該都離不開它吧🙂‍↔️ 因為他實在太聰明太好用啦！

那GPT背後其實就是採昨天有說到的Transformer 背後的encoder 機制，並且加上非常大量的資料所訓練而成的模型（這個資料量是你怎麼樣也想不到的多！！），除了是採用encoder 架構外，還有一特特點是他屬於生成模型，它的主要任務是「根據前面的文字去預測下一個最合理的詞」，所以它在文字生成上特別厲害。如果你常用gpt 的話，應該會發現你在用gpt時如果沒講完話直接送出，gpt 通常會直接幫你把話接完🙂‍↕️

Prompt 是什麼？？

我相信大家有聽過gpt的話，都多少聽過prompt、提示詞工程吧！
那到底什麼是prompt? 他跟gpt 的關聯也是啥呢？

概念其實非常簡單！就是一種是一種通過設計、引導、改進、優化的方式來提升模型的表現，並進一步可以幫助我們完成想指派的任務！

prompt 怎麼下對模型產生的結果有很大的影響，因為模型就是靠prompt 的上下文去產生相應的回覆，所以如何把我們的指令下達的清楚，讓模型能夠產出我們希望的回覆（不管是內容還是格式，還是一些其他的要求）就變得很重要。常見給prompt 的範本有幾個：

Zero-shot prompting
不給模型任何參考的範本，單存只給模型一些指示，要求模型完成指定的任務
這個方法的特點應該就是可以看出預訓練的模型本身有多少完成這個任務的能力(但當然怎麼樣設計prompt 的指示也很重要，表現得不好也可能是prompt 下的不夠明確，而非本身的pre-trained 知識不夠）

one-shot prompting:
算是小小小進階版，顧名思義就是給模型「一個」範例當作是參考

few-shot prompting
除了給模型相應的任務只是之外，會給予許多例子供模型參考（範圍通常是給10~100個例子）

優點：模型可以看到比較多在表現上面可能可以因此提升
缺點：看太多例子還是有可能造成overfitting 的問題

chain of thought
這個應該是前兩個的超級進階版xd, 除了給相應的指示＋範例之外會拆解問題成一小步一小步，提供如何拆解任務到最後得出正確答案的技巧給模型，主要就是希望模型學會「推理」，再回答時也會給予他推理的過程。會有這個方法出來是因為大家發現如果直接要求模型給予答案，很容易得不到正確的，但通過這種方式通常可以讓模型表現表現較好。

以解數學當一個範例，如果是one-shot prompting 可能無法讓模型回答正確