iT邦幫忙

2025 iThome 鐵人賽

DAY 7
0
生成式 AI

30天生成式AI入門與實作日記系列 第 7

[Day 7] 生成式 AI 的隨機性:Temperature 參數解析

  • 分享至 

  • xImage
  •  

到目前為止,我已經能讓GPT-2在Colab上成功產生文字。今天要來試試看:透過調整一些參數,能不能改變生成結果的風格。

什麼是temperature?
在生成文字時,模型其實是透過機率來挑選下一個字

  • temperature低:模型會更保守,只會挑選機率最高的字 → 內容通常比較穩定、但會有重複的狀況。
  • temperature高:模型更容易嘗試機率較低的字 → 內容會比較有創意、但有時會出現較混亂的狀況。

實際操作
我在 Colab 裡輸入這段程式碼,讓GPT-2幫我生成文字,分別設定temperature=0.2和temperature=1.0。
https://ithelp.ithome.com.tw/upload/images/20250916/20169387iOvJqxgwad.png
第一次輸入後,發現兩種溫度對我給的prompt The future of AI in medicine is
產生的結果沒有很顯著的差別,推測可能是程式中設定的token數量太少了。
因此將token數量從50改至100後,再次測試。
https://ithelp.ithome.com.tw/upload/images/20250916/201693875YewMoSD12.png
這麼一來,兩種溫度造成的結果就有很明顯的差異:

  • Temperature = 0.2
    發覺它幾乎陷入一種洗版的模式,不斷重複The world is still in the early stages of developing AI.這句話。這就是低溫的特徵,模型很保守,只挑最有可能的詞,結果就是一直重複,像卡在一個安全但單調的迴圈。
  • Temperature = 1.0
    而高溫的結果,雖然還是圍繞在「AI in medicine」這個主題,但開始出現更多不同說法,甚至帶進「replace human medical systems」、「health care services」這種比較多樣的內容。這就是高溫的特徵,比較有創意,不會一直出現重複內容,但不保證正確性。

第一週主要都在做環境建置和參數嘗試,這些過程雖然比較基礎,但讓我把生成式 AI 是怎麼跑起來的這件事搞清楚了。第二週我會嘗試進行一些生成式AI常見的應用,繼續加油吧!


上一篇
[Day 6] 什麼是 Token?AI 為什麼要切詞?
下一篇
[Day 8] 文字摘要:幫文章濃縮重點
系列文
30天生成式AI入門與實作日記8
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言