迴歸問題是監督式學習的一種,主要目的是從Data-set裡頭找到一個函數,得以在輸入特徵值後輸出一個預測值。
數據擬合曲線
舉個例子,房子價格與坪數之間的關係。我們想要從data-set裡的房子大小,預測出房子的售價落點在哪裡,
size of feet^2(x) | Price($) in 1000's (y) |
---|---|
2104 | 460 |
1406 | 352 |
1534 | 232 |
853 | 178 |
... | ... |
將以上的數據畫成圖表之後,如下圖所示,x軸為房屋的大小,y軸為房子的價格,每一個紅叉叉都是數據在圖表上的落點。
接著我們根據這些點擬合出一條直線,如上圖中粉紅線直線。得到擬合結果之後,我們便可以根據直線的線性方程,去預測房屋價格,例如1250feet^2的房子,價格大約會落在$220左右,
從上面的結果裡,我們肯定有一個疑問:怎麼能夠看出線或函數擬合的好不好呢?
答案是在擬合的過程中,我們需要引入Cost Function做為標的,Cost Function越小,代表我們擬合得到的線性方程其輸入特徵值與輸出預測值的結果和真實數據越接近,可以說我們利用迴歸分析,得到了一個相當準確的預測模型。