iT邦幫忙

第 11 屆 iT 邦幫忙鐵人賽

DAY 15
0

在前面先前的課程中學習如何去最佳化我們的模型,然而表現最好的模型實際上並不一定是我們最佳的選擇,過擬和(overfitting)及是常見的問題,更是我們要在最佳化和泛化間取捨的重點。


最好的模型是它能表現出那些尚未出現的數據點特性,我講得有點饒口或模糊,看圖會更清楚些~
https://ithelp.ithome.com.tw/upload/images/20191001/20120115oVf67AW5BA.jpg
再把我們的寶寶搬出來(誤 這預測的藍線似乎有一定程度的效果吧? Pretty GOOD! 或許我們能在走火入魔一點
https://ithelp.ithome.com.tw/upload/images/20191001/20120115pWjbSciZiA.jpg
RMSE=0!!! 神準的預測每個寶寶待媽媽肚子理多久就多重,它說這關係是有算式的而且它有

對嗎? 哇,這根本不能用了... 所謂泛化(Generalization)就是在這兩者間的取捨,盡可能預測準但又要有用,怎麼知道有用?數據拿到手時分一部份留著別拿去訓練,這樣就能驗證避免過擬和啦


上一篇
Day14 性能評估
下一篇
Day16 數據集實做
系列文
想使自身成長就先從連續30天的機器學習開始吧!31

尚未有邦友留言

立即登入留言