上篇介紹如何依照需要的狀況決定函式,此篇將介紹如何在點與點間尋找回歸線減少偏差值。
Simple Linear Regression: Finding a relationship between two continuous variables; y = f(x)
基本上DataSet會有N個例子(行),例子中會有M個輸入屬性(列);
在線性回歸中可以使用error function (Mean Squared Error) 去判斷一開始假設的h(x)是否準確,
常見的計算方法為:(h(x)-f(x))^2
也就是用平方來去取線與點之間的距離。
取偏差值的公式:
先取距離後全部加總再取平均值,前面的1/2是為了方便計算所做的梯度下降。
如果只有一個屬性: h(x) = b + w1x
b是y的截距,w1是斜率
則計算方法為: