iT邦幫忙

2025 iThome 鐵人賽

DAY 20
0
生成式 AI

30天生成式AI入門與實作日記系列 第 20

[Day 20] 模型大小 vs Prompt設計,哪個更重要?

  • 分享至 

  • xImage
  •  

前面這幾天,我一路從GPT-2、Qwen mini這些小模型玩起,到最近總算把Gemma-3-1B-Instruct跑起來。
感受最深的就是:大模型真的比較聰明,但也不是一切靠大模型就好。

今天就不實作程式了,來聊聊一個很實際的問題:
到底是模型大小比較重要,還是Prompt 設計比較重要?

模型大小的差別
以GPT-2和Gemma來比:

  • GPT-2:常常文字接龍,甚至重複卡住,像之前面臨過的「蛇和蛇和蛇…」循環。
  • Gemma:就算問到比較tricky的問題,至少會努力維持在合理的回答範圍。

很明顯,模型越大、訓練越新的,知識量跟穩定度就越高。
如果要做專題或研究,這點很關鍵,不然一直洗版真的很浪費時間。
/images/emoticon/emoticon06.gif

Prompt的力量
但我也發現,Prompt有時候比模型本身還關鍵。
舉例:
GPT-2如果只是丟「寫一首詩」,它就亂跳。
可是加上Few-shot Prompting(給幾首範例詩),它就能比較穩定地模仿。

同樣地,在Gemma上,好的Prompt可以把它的潛力發揮到最大,
例如指定「請用小學生能懂的方式解釋」或「請用條列整理」,輸出就會更貼近需求。

到目前為止,我會把兩者的關係這樣看待:
模型大小=底子(知識量、語言能力)
Prompt設計=導演(引導它走對的方向)
就像一個演員:
演員本身有沒有實力,當然很重要;
但導演(Prompt)的指令對了,才能演出符合劇情的效果。

所以回到今天的問題:
模型大小 vs Prompt設計,哪個更重要?
我的答案是——兩者缺一不可。


上一篇
[Day 19] 幻覺現象:AI會亂掰嗎?
系列文
30天生成式AI入門與實作日記20
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言