量刑的研究之所以重要,在於檢驗審判者是否能夠在類似案件中做出一致的判決,而不會因個別差異導致結果大相逕庭,從而確保公平性。然而,由於法官在司法審判中擁有超然的獨立性,他們會根據自己的經驗和價值觀來決定量刑,因此即使面對類似的案件,量刑結果也可能有所不同。這種差異往往難以讓民眾了解背後的考量原因,因此引發了關於量刑公正性的疑問。
Lodi因此產生了一個有趣的思考:生成式AI,由於沒有個人經驗和價值觀的影響,是否能在類似案件的事實中,做出一致且相對公正的判決呢?為了驗證這個假設,Lodi進行了一項實驗,測試生成式AI是否能在相似的詐欺案件中給出合理且一致的量刑建議。
Lodi在司法院判決書查詢系統選擇了幾個詐欺案件來進行測試,這些案件的選擇基於以下共通點:
選定的案件如下:
Lodi接下來將這些案件的事實交由生成式AI(GPT-4)進行量刑建議,期望能測試AI在這些相似案件中的判斷。
案件編號 | 法院判決刑期 | GPT建議量刑 |
---|---|---|
台北地方法院111易299號 | 有期徒刑1年2個月 | 4年6個月有期徒刑,並併科罰金30萬元 |
桃園地方法院112易74號 | 有期徒刑1年 | 3年6個月有期徒刑,並併科罰金30萬元 |
高雄地方法院111易字362號(陳OO) | 有期徒刑1年2個月 | 4年有期徒刑,並併科罰金50萬元 |
高雄地方法院111易字362號(周OO) | 有期徒刑1年6個月 | 4年有期徒刑,並併科罰金50萬元 |
在這次實驗中,可以了解到AI有能力根據不同的案件給出不同的量刑判決,但是,AI給出的量刑建議普遍高於法院的實際判決。惟在幅度尚具有一定程度的一致性,法院所判的刑期約在一年至一年二月間,而AI所判的刑期約在三年六月至四年間。這或許表明AI傾向於根據犯罪金額和案件複雜性進行較為嚴厲的量刑。這一結果顯示出,雖然AI能根據事實與法律條文進行判斷,但在量刑標準上仍與實務有所不同,尤其在缺乏具體的量刑基準時,AI似乎更容易給出重判。
接下來,Lodi將會嘗試提供更多資訊嘗試訓練AI!