廢廢最近打完疫苗不太舒服一不小心就斷更了,在這裡說聲抱歉啊!
方法(一):
簡單來說呢,原本訓練資料20萬:20萬:40萬:1.6萬資料差距過大,取平均變為20萬:20萬:20萬:1.6萬,來看一下結果如何吧!準確率34%。
方法(二):
將資料分為20萬:20萬:20萬,至於1.6萬資料就不要了。準確率53%。
方法(三):
將資料分為20萬:20萬:40萬,不取平衡數據且1.6萬資料也不要了。準確率61%。
方法(一)看就知道,不能用超怪;方法(二)預測的資料正確率很平均大約落在50%的區間,準確率53%而已;方法(三)預測的資料幾乎都在label 3正確率80%並且label 1和2正確率落在40%。
依照目前做法,我是把棄牌與all-in拿掉並且使用方法(三),這樣有個問題是有可能會預測輸出label 3(check)多一點;使用方法(二)預測輸出會平均,但是訓練資料會減少。humm...讓我再思考一下。