在前面先前的課程中學習如何去最佳化我們的模型,然而表現最好的模型實際上並不一定是我們最佳的選擇,過擬和(overfitting)及是常見的問題,更是我們要在最佳化和泛化間取捨的重點。
最好的模型是它能表現出那些尚未出現的數據點特性,我講得有點饒口或模糊,看圖會更清楚些~
再把我們的寶寶搬出來(誤 這預測的藍線似乎有一定程度的效果吧? Pretty GOOD! 或許我們能在走火入魔一點
RMSE=0!!! 神準的預測每個寶寶待媽媽肚子理多久就多重,它說這關係是有算式的而且它有
對嗎? 哇,這根本不能用了... 所謂泛化(Generalization)就是在這兩者間的取捨,盡可能預測準但又要有用,怎麼知道有用?數據拿到手時分一部份留著別拿去訓練,這樣就能驗證避免過擬和啦