今天來介紹損失函數 (Loss Function),損失函數主要功能是把事件與其成本進行對應,而我們在訓練模型時,最終目的就是希望可以得到最小的損失函數,以將成本降到最低,白話一點來說,就是我們希望模型預測結果跟理想結果不要相差太多,因此我們可以透過各式各樣的損失函數來進行評估。
首先迴歸分析時常用的均方誤差 (Mean Square Error, MSE),它透過將所有誤差值平方後再進行計算,那為什麼要先平方呢,想像如果誤差值是5、10、15,平均誤差值就會是10,但如果誤差值是5、10、-15,平均誤差值就變成0了呢,也因為這個原因,所以我們需要先把誤差值進行平方,再去算其平均值,才能真正表現出預測值與理想值間的誤差狀況。
接下來是均方根誤差 (Root Mean Square Error, RMSE) ,RMSE就是MSE值之平方根,而RMSE值越高就代表這個模型的品質越差,也就是預測結果越不準確的意思,以下圖為例,右圖之RMSE大於左圖之值,因此我們可以知道右圖的模型比起左邊是更不準確一點的。