[Python]回歸模型01─運用OLS做回歸

python python3 regression linear regression ols

Eric HSIEH 2022-01-26 21:54:03 ‧ 14881 瀏覽

分享至

Hi! 大家好，我是Eric，這次要來用Python做回歸模型。

緣起：回歸模型是常見的分析方法，可用來分析數值變數之間的關係。
方法：運用 [Python]的[statsmodels.api] 套件。
使用資料：臺北市交通統計月報-公車運量、臺北市政府民政局-人口數、新北市政府民政局-人口數、臺北大眾捷運股份有限公司-捷運運量
參考來源：
https://www.twblogs.net/a/5b7a95f72b7177392c966121
https://learnku.com/articles/39890
https://info.todohealth.com/22056516
ttps://www.statsmodels.org/dev/generated/statsmodels.regression.linear_model.OLS.html

1. 載入套件。

import statsmodels.api as sm     #回歸模型套件
import numpy as np               #資料處理套件
import pandas as pd              #資料處理套件

2. 輸入資料。

df0 = pd.read_csv("TaipeiAllBus 0105.csv")   #輸入資料
df0

3. 資料前處理。

df0_X = df0.drop("volumn", axis=1)           #將作為y的變數volunm刪去，並另存為x
df0_X1 = df0_X.drop("transfer01", axis=1)    #之後要做相關係數，而因為transfer01變數為虛擬變數，故不須納入做相關係數，故刪除

df0_y = df0[["volumn"]]      #製作變數y

4. 相關係數檢驗。

rDf0 = df0_X1.corr()  #查看數據間的相關係數
print(rDf0)


%matplotlib inline
sns.set(font_scale=1.5)

sns.set_context({"figure.figsize":(8,8)})
sns.heatmap(data = rDf0, square = True, cmap="RdBu_r", annot = True)

5. 檢視資料分布情形。

import seaborn as sns               #載入分布圖形套件
import matplotlib.pyplot as plt     #載入畫圖套件

sns.pairplot(df0, x_vars=["People","MRTpax", "shift", "kilometer"], y_vars='volumn', size=7, aspect=0.8, kind='reg')  
plt.show()

6. 建模。

df0_X = sm.add_constant(df0_X)   #增加模型的常數，使更為符合回歸模型

model0 = sm.OLS(df0_y, df0_X)    #OLS回歸
results0 = model0.fit()

print(results0.summary())

7. 大功告成。
下圖就是回歸的結果，可以看到各個x變數的係數，以及P值，檢驗哪些x變數對於y具有顯著影響，另外也可由R2檢驗模型的解釋能力。

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

37 組

團體組數

1 組

累計文章數

23 篇

最後報名日

9/15

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

ChatGPT Business & Codex 如何從零開始?

IT邦幫忙

[Python]回歸模型01─運用OLS做回歸

尚未有邦友留言

標記使用者