iT邦幫忙

2018 iT 邦幫忙鐵人賽
DAY 4
1

Regression

截至目前為止,我們假設與房屋價格關聯的只有房子的坪數,但是你知、我知、獨眼龍也知,那有這麼簡單呢?

Adding other features

當我們用坪數大小衡量自己家附近房價時,假設有一間房子跟我差不多大小差不多地段

那當我使用回歸分析時(只考慮地坪),理性上是否應當直接採納呢?

我們甚至不用透過分析,就能直接給出否定的答案

因為決定房子的價格不僅僅只是房子大小會影響,格局、學區遠近、交通....

此時我們必然需要加入更多的特徵

以下圖為例,若將廁所也納入特徵時,我們可以得出這樣的立方體,而原先的線也會變成立方體的切面
https://ithelp.ithome.com.tw/upload/images/20171222/20107448QTFLeGZi6Y.png

方程式為 w0截距、w1乘上面積、w2乘上廁所

只是到底那個特徵是重要的呢?接下來的課程將會慢慢的討論

Regression ML block diagram

https://ithelp.ithome.com.tw/upload/images/20171222/20107448Mfm7gZFZoi.png

還記得day0那幾張狗啃的圖嗎?沒錯我又在浪費才能了(誤

現在我們可以在從那張圖加上我們之前所學的做延伸

  • 收集訓練集(建案名字、價格、特徵)
  • 接著我們提取某些我們認為重要的特徵X(坪數、公設比、交通....)
  • 最後透過回歸,得出預測的房價
  • 機器學習的模型(此例為回歸),都一定會有一組參數
  • w又稱為回歸係數,其內涵為大小幾坪?公設比多少?幾間廁所...
  • y代表測試集(實際的出售價格)
  • 我們使用的便是殘值平方合(將真實與預測的差平方相加)
  • 接著在整個訓練集的房屋上求合
  • 最後將損失輸到到一個機器學習的演算法用它來更新那些係數的權重

Reference:


上一篇
[day 2] 回歸分析-2
下一篇
[day 4] 分類-1
系列文
到底是在learning什麼拉30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言