iT邦幫忙

2022 iThome 鐵人賽

DAY 5
0

今日大綱

  • 什麼是邏輯斯迴歸?
  • 最大概似估計
  • 線性迴歸 vs. 邏輯斯迴歸

什麼是邏輯斯迴歸?

邏輯斯迴歸為線性迴歸的變形,其經過sigmoid function的轉換,讓目標變數(y)的範圍所小至0-1之間。Sigmoid function又稱logistic function,經過轉換所得到的值為機率,進一步判斷是否高於或等於0.5,如果高於或等於0.5,那預測值就為1;反之,則為0。分類的門檻值(threshold)通常使用0.5當分界,如果想改變門檻值可以利用dataframe篩選資料,想了解的朋友可以參考Define threshold of logistic regression in Python
下圖為sigmoid function,當x為0時,所得到的預測值為0.5。
https://ithelp.ithome.com.tw/upload/images/20220918/20145688OAnX1nIhie.png

邏輯斯迴歸方程式 (Gambella et al., 2021) 如下:
https://ithelp.ithome.com.tw/upload/images/20220918/20145688pPqgGh42gk.png

e 指的是指數,betabeta0 分別代表各個特徵的係數與截距項,h 為sigmoid function。

最大概似估計

不同於線性迴歸,邏輯斯迴歸無法計算誤差,需利用最大概似估計法將每個資料點的概似值相乘,得到最適合的模型,其數學式 (Gambella et al., 2021) 如下:
https://ithelp.ithome.com.tw/upload/images/20220918/20145688nUsFTLwJ5s.jpg
藍色框框所計算的是y=1的概似值,而橘色框框所計算的則是y=0的概似值。

下圖為最大概似估計法的解說圖,資料來源為StaQuest,一開始會模擬出一個模型,並且計算這個模型的概似值後,接著找下一個可能的曲線,當概似值為最大時,其為最佳解。
https://ithelp.ithome.com.tw/upload/images/20220918/20145688PS58l2sCtQ.png

線性迴歸 vs. 邏輯斯迴歸

  1. 線性迴歸的目標變數為連續變數,進行預測,而邏輯斯迴歸的目標變數為二元變數,處理分類的問題。
  2. 線性迴歸的函數為線性函數,邏輯斯迴歸為sigmoid函數。
  3. 線性迴歸計算參數方式為最小平方法(Ordinary Least Square),邏輯斯迴歸為最大概似估計法(Maximum likelhood)。

https://ithelp.ithome.com.tw/upload/images/20220918/2014568809MIwz0HiY.jpg

參考資料

感謝您的瀏覽,我們明天見!☺


上一篇
【Day 4】使用線性迴歸預測加州房價 Predict the house price in CA using linear regression
下一篇
【Day 6】邏輯斯迴歸實作 Logistic regression Implementation
系列文
從機器學習到深度學習 - 30天搞懂常見演算法的基礎理論30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言