11 廣義線性模型

2019 iT 邦幫忙鐵人賽

DAY 10

AI & Data

機器學習模型圖書館：從傳統模型到深度學習系列第 11 篇

2019鐵人賽 machine learning 機器學習 glm

杜岳華

2018-10-11 13:24:51

4743 瀏覽

分享至

我們前面探討了不同的資料型態可以對應不同的迴歸模型。

不覺得每個迴歸模型都有那麼點相似的地方嗎？

線性迴歸：

$\mathbb{E}[y] = \mu = \mathbf{w}^T\mathbf{x} + b$

羅吉斯迴歸：

$https://chart.googleapis.com/chart?cht=tx&chl=ln(%5Cfrac%7B%5Cmathbb%7BE%7D%5By%5D%7D%7B1%20-%20%5Cmathbb%7BE%7D%5By%5D%7D)%20%3D%20ln(%5Cfrac%7Bp%7D%7B1%20-%20p%7D)%20%3D%20%5Cmathbf%7Bw%7D%5ET%5Cmathbf%7Bx%7D%20%2B%20b$

Poisson 迴歸：

$ln(\mathbb{E}[y]) = ln(\lambda) = \mathbf{w}^T\mathbf{x} + b$

在右手邊的部份都是一樣的，是一樣的線性組合加上一個常數。

差別在於預測出來的數值是怎麼連結到目標變量的平均值上 $\mathbb{E}[y]$ 。

是的，我們在預測的都是目標變量的平均值。

鏈結函數（link function）

要連結目標變量的平均值 $\mathbb{E}[y]$ 跟線性組合加上一個常數.....，姑且叫他 $\eta$ 好了。

$\mathbb{E}[y] \leftrightarrow \eta$

統計學家發展出使用鏈結函數來連結這兩者，所以不同的資料型態會對應不同的鏈結函數。

線性迴歸使用 identity function $y = x$ ：

$\mathbb{E}[y] = \eta$

羅吉斯迴歸使用 logit function $https://chart.googleapis.com/chart?cht=tx&chl=y%20%3D%20ln(%5Cfrac%7Bx%7D%7B1%20-%20x%7D)$ ：

$https://chart.googleapis.com/chart?cht=tx&chl=ln(%5Cfrac%7B%5Cmathbb%7BE%7D%5By%5D%7D%7B1%20-%20%5Cmathbb%7BE%7D%5By%5D%7D)%20%3D%20%5Ceta$

Poisson 迴歸使用 log function $y = ln(x)$ ：

$ln(\mathbb{E}[y]) = \eta$

廣義線性模型（generalized linear model）

這麼一來我們就可以把三個模型搓一搓做成 ~~撒尿牛丸~~ 廣義線性模型啦！

$y \overset{f}{\longleftrightarrow} \mathbb{E}[y] \leftrightarrow \eta = \mathbf{w}^T\mathbf{x} + b$

對應不同的目標變量，我們就有了萬用的模型，就像物理的大一統理論一樣。

廣義線性模型其實包含了三個部份：

鏈結函數
線性預測子
指數族

線性預測子（linear predictor）

統計學家特別給了一個線性預測子這樣的名字。

$\eta = \mathbf{w}^T\mathbf{x} + b$

這代表要從預測變量 $\mathbf{x}$ 去預測我們的目標變量，其中 $\mathbf{x}$ 的變數之間都是 互相獨立 的。

互相獨立的變數之間，要以 線性組合 來預測我們的目標變量。

指數族（exponential family）

可是每一種資料的機率分佈都可以接上廣義線性模型嗎？答案是否定的。

$y \overset{f}{\longleftrightarrow} \mathbb{E}[y]$

統計學家研究了一下這個模型，發現只有符合指數族的條件才能夠用。

指數族長成這樣：

$https://chart.googleapis.com/chart?cht=tx&chl=f(%5Cmathbf%7By%7D%20%5Cmid%20%5Cmathbf%7B%5Ctheta%7D)%20%3D%20%5Cfrac%7B1%7D%7BZ(%5Cmathbf%7B%5Ctheta%7D)%7D%20h(%5Cmathbf%7By%7D)%20exp(%5Cmathbf%7B%5Ctheta%7D%5ET%20%5Cphi(%5Cmathbf%7By%7D))$