昨天,我們再次體驗了 Gemini 將複雜藍圖一鍵化為現實的魔力,並完成了股債平衡與再平衡模擬器的初步建構與微調。
但如同我們感受到的,這個工具的計算邏輯遠比退休金計算機複雜。它包含隨機性,每次模擬的結果都不同。那麼......我們該如何驗證一個動態、不可預測的系統呢?今天,我們的驗證思維,需要「核對最終答案」,升級為「檢驗遊戲規則」,確認 AI 是否真的理解並遵守了我們設定的市場模擬規則。
驗證法:馴服隨機法(Taming the Randomness)
這是驗證動態模擬最強大的技巧。既然隨機性讓我們難以預測,那我們就先命令 AI 暫時移除隨機性,讓模型變回一個可預測的狀態。
【實戰演練】
為了方便我進行驗證,請你暫時修改這個模擬器的計算邏輯。請將「市場波動率」的影響設定為 0,也就是說,每一年股票和債券的實際報酬率,就等於我輸入的「預期年化報酬率」,不要有任何隨機波動。
當波動率被設為 0% 後,這個模擬器就退化成了一個單純的「複利計算機」。這時,我們就可以用 Day 8 的「特定值驗證法」,拿試算表或計算機來核對 AI 的基礎運算是否正確。這一步是為了確保在加入隨機性之前,工具的底層數學邏輯是正確的。
(這時看圖表,就是很平滑的兩條線。)
〈圓滑的圖表〉
在確認基礎邏輯無誤後,我們要讓隨機性回來,才能進行下一步的測試。因此我們可以對著 Gemini 說出想要復原的指令:
我已經檢驗結束,請幫忙把「市場波動率」調回原狀吧。
過一下子就恢復原樣囉!當然,如果不放心的話,也可以點擊按鈕,看圖表有沒有顯示出隨機性。
「再平衡」是一個條件式的行為,只在特定情況下觸發。我們如何確保 AI 真的在「對的時間」做了「對的事」呢?
驗證法:「必觸發情境」設計法(Forced-Trigger Scenario)
我們要設計一個極端的場景,確保「再平衡」的條件在第一年就必定會被觸發,然後用計算機一步步手動驗算 AI 的行為是否正確。
【實戰測試案例】
今天我們學會了如何像一位專業的品保工程師一樣,透過「馴服隨機」和「設計極端案例」這兩種進階技巧,來驗證一個複雜的動態模擬器。
在確保了工具的可靠性後,明天我們將正式進入 AI 溝通術的世界,學習如何讓 AI 的產出,更具備我們的個人風格與專業度。