在建立多個regression models後,我們常要選擇一個指標來衡量模型好壞,今天來聊聊各個不同的指標~
MSE主要以平方來避免誤差正負的互相抵銷,但也因為平方的特性,所以當單一bias大的時候會有懲罰作用,也就是說MSE對於極值(outliers)會相對敏感。
RMSE主要就是MSE拿去取根號,取根號的目的是讓他與y的單位變得一致,所以解釋起來會比較直觀!
抵銷正負誤差的方式,除了平方之外,還有取絕對值,MAE就是取絕對值來計算平均誤差,相對之下對極值比較不敏感,如果training data裡面極值很多,那可以考慮用MAE來當作指標。
將誤差轉換為百分比(徹底擺脫單位),主要目的也是解釋起來比較直觀,要記得如果y含有0就不能使用MAPE!