[Day3] 線性迴歸（Linear Regression）

2018 iT 邦幫忙鐵人賽

DAY 3

AI & Machine Learning

Machine Learning 與 Deep Learning 筆記系列第 3 篇

2018鐵人賽 linear regression 線性迴歸

愷開

2017-12-22 12:38:35

10265 瀏覽

分享至

線性迴歸（Linear Regression）

線性迴歸，是個在機器學習常常聽到的一個專有名詞，如果有修過統計學相關的課程，對這個名詞也一定不陌生。

線性相信大家一定理解，不過迴歸到底是什麼？

怎樣的行為才能被定義為回歸呢？維基百科這樣說：

目的在於找出一條最能夠代表所有觀測資料的函數

用此函數代表因變數和自變數之間的關係。

因此，用白話一點的方式來說，線性迴歸的意思就是**「找出一條直線，這條直線能夠代表目前的資料走向」**。

直接用算式表達的話，就是國高中數學經常出現的：

給定兩個點，我們就可以帶入上式求得直線。而線性迴歸也是在做同樣的事，只是差別在於：

求方程式時我們是給定了點的座標，但通常資料的座標我們不知道，會分布在各處
線性迴歸透過不斷調整 a（權重）的方式，試圖找到一個最佳解。

（這邊的 a 通常被稱作權重，因此 a 也常常用 w weight，權重來表達，而 x 被稱為特徵）

再來，我們看到下面這兩張圖，這就是線性迴歸在做的事：

你認為哪一張的線比較能代表資料的分佈情形？

第一張對吧，我們可以看到線的走向（斜率）跟資料座標分布的趨勢是差不多的。雖然我們可以用肉眼觀察這件事，但對於電腦來說要如何判別呢？

點的距離

首先我們先將求得的方程式代入目前的點看看，這些代表資料上的點跟目前的線的距離，我們通常稱為誤差（error），也有人叫做損失（cost）。

把誤差加總後就是這條線和目前的資料的總誤差值，我們希望這個值越小越好。

最小平方法

如果我們把這條線跟平面上的每個點的距離做加總再算平均，會發現其實上面第一條線的誤差並不大，原因是：

如果依照上面的式子做運算，error 有可能會出現正負，而正負抵消就會把我們誤差給消掉。導致第一條線也被電腦認為是一條理想的線。

因此，稍微修改一下：

我們想要最小化 error，明天我們會介紹一個在機器學習當中常常用來找最小值的技巧 — 梯度下降法

應用

像是房價預測、股市預測等等，都可以用 linear regression 來做分析，例如房價可能會和房屋大小有關係，我們可以找自己認為合理的特徵來訓練。只要找到適當的權重值 W，就可以得到預測的點。

[Day2] 什麼是機器學習？

[Day4] 梯度下降法（Gradient Descent）

系列文

Machine Learning 與 Deep Learning 筆記共 10 篇

RSS系列文訂閱系列文

23 人訂閱

完整目錄

直播研討會

1 則留言

patrickcheng

iT邦新手 4 級 ‧ 2018-02-05 12:33:38

簡明易懂， good job.

回應
檢舉

登入發表回應

我要留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22201 篇

完賽人數

600 人

第一次寫Operator就上手

Kubernetes Summit |

82 分

ML Life Cycle for LINE Shopping Recommender

Hello World Dev Conference |

39 分

資料庫保護全攻略 (一) 提升金融資安的三大密技

CipherTech 亞利安科技 |

31 分

F5 Kubernetes Networking - 多雲容器網路解決方案系列第三堂：進階議題 : 應用安全防護/多集群-多中心-多雲

IT EXPLAINED |

56 分

ESG永續管理也需要數位轉型！如何讓永續管理既高效又符合國際標章？【宏碁資訊網路學堂】

ＡＥＢ大補帖 |

52 分

衝出新手村，開發與維運的體驗進化之旅

DevOpsDays |

22 分

萬物上雲! WAAP高數位時代企業資安防護守門員!

Cloud Summit 臺灣雲端大會 |

25 分

2023 亞利安科技 Solution Day 開場及議程 - 資安合規及內外兼顧的安全防禦

CipherTech 亞利安科技 |

42 分

透過 Red Hat AMQ 解構大型服務、建立可靠的資料流

IT EXPLAINED |

38 分

MongoDB Atlas Search

IT EXPLAINED |

28 分

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙

Machine Learning 與 Deep Learning 筆記系列 第 3 篇