【Day4】First：損失函數

第 11 屆 iThome 鐵人賽

DAY 4

Google Developers Machine Learning

Machine Learning（by Google）系列第 4 篇

11th鐵人賽 machine learning ml machinelearning google

eyelash*睫毛

2019-09-19 23:11:42

2752 瀏覽

分享至

機器學習的目標，就是要預測未來，預測能越準越好，但是要怎麼知道準不準確呢？這時候「損失函數」（loss function）就很好用了！
當損失函數越小，表示這個model設計越好，反之，就要考慮換別的model了。

根據教學範例，她提到一個現象「蟋蟀在越高溫度叫的頻率越高」。他們把這個現象整理成每分鐘有多少叫聲（x軸）和溫度（y軸）的X-Y軸圖。（如下圖一）

〈圖一〉

可以看到有個左下到右上的趨勢，在那個趨勢上畫一條線，這就是我們的「model」，我們可以根據溫度，來預測蟋蟀每分鐘可以叫幾次。（如下圖二）

〈圖二〉

但是我們設計了一個model（紅色的線），我們要怎麼知道這個model是可以用的，誤差是大是小？這時候就是機器學習的重要的判斷方式：均方誤差（Mean square error，MSE），還有「平均絕對值誤差」(Mean absolute error，MAE)。兩者都可以達到我們想要判斷的目標，他們有個明顯的差異，MSE的線圖是曲線，比較滑潤，而MSA是直線性的，比較硬（聽起來好奇怪）。
均方誤差的公式為：
MSE
所以是，我們的「真正資料」減去「預測資料」的平方，然後再除以數據資料的數量之總和。