今天要學習的是邏輯回歸
左圖是今天的範例
我們想要預測不同年紀的顧客購買產品的機率
機率高 => 會買
機率低 => 不會買
我們一樣可以用線性回歸畫出一條線
線段在0,1 中間這段是有意義的 -> 代表一個顧客有多少機率會購買產品
但是左邊和右邊並不適用(最年輕和最年長的客戶)
因此這兩段線需要用別的方法來畫
上圖擷取自課程投影片
黑色的線可以用 y = b0 + b1 * x 來表示
然後從Sigmoid Function(S函數) 可以推出 y 是多少
結合量變數就會變成綠色公式
綠色公式可以畫出第二張圖所看到的綠線
綠線上所有的點都介於0~1之間
所以我們就完成了一條可以預測機率的線了
訓練集本身就是由一堆離散的點組成 (不是0就是1)
而模型上面的點都會加上一頂帽子來表示預測結果
假設現在有客戶年齡分別是20-50歲
對應到的y軸值就是購買產品的機率
至於客戶會不會購買產品要怎麼決定呢?
我們可以畫一條線在y=0.5 的地方
所有在0.5 以下的點, 我們都預測客戶不會購買產品, 因為機率小
所有在0.5 以上的點, 我們都預測客戶會購買產品, 因為機率大
假設我們有四組客戶資料
套用模型後的結果:
左下兩個點會被投射到y_hat=0
右上兩個點會被投射到y_hat=1