iT邦幫忙

2022 iThome 鐵人賽

0

廢廢最近打完疫苗不太舒服一不小心就斷更了,在這裡說聲抱歉啊!

平衡數據

方法(一):
簡單來說呢,原本訓練資料20萬:20萬:40萬:1.6萬資料差距過大,取平均變為20萬:20萬:20萬:1.6萬,來看一下結果如何吧!準確率34%。
https://ithelp.ithome.com.tw/upload/images/20221022/20145527q0hITfyk5d.png
方法(二):
將資料分為20萬:20萬:20萬,至於1.6萬資料就不要了。準確率53%。
https://ithelp.ithome.com.tw/upload/images/20221022/20145527XWEVoJOQH4.png
方法(三):
將資料分為20萬:20萬:40萬,不取平衡數據且1.6萬資料也不要了。準確率61%。
https://ithelp.ithome.com.tw/upload/images/20221022/2014552727ZOHIoYm7.png

方法(一)看就知道,不能用超怪;方法(二)預測的資料正確率很平均大約落在50%的區間,準確率53%而已;方法(三)預測的資料幾乎都在label 3正確率80%並且label 1和2正確率落在40%。

依照目前做法,我是把棄牌與all-in拿掉並且使用方法(三),這樣有個問題是有可能會預測輸出label 3(check)多一點;使用方法(二)預測輸出會平均,但是訓練資料會減少。humm...讓我再思考一下。


上一篇
DAY 35 刪除all-in label
下一篇
DAY 37 策略決定
系列文
關於因耍廢太久而必須挑戰5個月上研究所的廢廢38
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言