iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 28
0
AI & Data

連接數學與現實世界的橋樑 -- 數學建模系列 第 28

Day 28 : 隨機模型 -- 線性回歸

  • 分享至 

  • xImage
  •  

線性回歸是使用最普遍的隨機模型,它假設狀態變數的期望值是時間的線性函數。根據維基百科的定義,利用線性回歸方程式的最小平方函數對一個或多個自變數和應變數之間關係進行建模的一種回歸分析。

範例

私人家庭可調節的抵押貸款率通常是根據若干市場指數之一來確定的。貸款者的抵押貸款是依據每年5月的一年期公債(CM1)到期的指數來調節,下表是從1986年6月開始的三年期的歷史資料,請使用這些資料來預測1990年5月此指數的估計值。
https://ithelp.ithome.com.tw/upload/images/20190929/201196001chfRHxJam.jpg
https://ithelp.ithome.com.tw/upload/images/20190929/20119600ZIXH53G9We.jpg

  1. 提出問題
    我們想要估計隨機波動且隨時間而增長的變量其未來的趨勢,故令https://chart.googleapis.com/chart?cht=tx&chl=X_t為1986年5月後第https://chart.googleapis.com/chart?cht=tx&chl=t月一年期公債到期的指數。根據需求為估計https://chart.googleapis.com/chart?cht=tx&chl=X_48,如果假設https://chart.googleapis.com/chart?cht=tx&chl=X_t部分依賴於隨機元素,則無法精確的預測https://chart.googleapis.com/chart?cht=tx&chl=X_48。因此,最好是得到https://chart.googleapis.com/chart?cht=tx&chl=E(X_48)
  2. 選擇建模方法
    此例使用線性回歸模型,https://chart.googleapis.com/chart?cht=tx&chl=X_t%20%3D%20a%20%2B%20bt%20%2B%20%5Cvarepsilon_t,其中https://chart.googleapis.com/chart?cht=tx&chl=a%2C%20b為實常數,https://chart.googleapis.com/chart?cht=tx&chl=%5Cvarepsilon_t是隨機波動隨機變量,服從標準常態分配(https://chart.googleapis.com/chart?cht=tx&chl=E(%5Cvarepsilon_t)%20%3D%200%2C%20Var(%5Cvarepsilon_t)%20%3D%201)
    因此,估計https://chart.googleapis.com/chart?cht=tx&chl=E(X_t)%20%3D%20a%20%2B%20bt問題就轉換成求解估計參數https://chart.googleapis.com/chart?cht=tx&chl=a%2C%20b的問題。
  3. 推導數學表達式
    根據CM1數據資料,https://chart.googleapis.com/chart?cht=tx&chl=(t_1%2C%20y_1)%2C%20%20%5Cdots%2C%20(t_n%2C%20y_n),找出使得擬合這些資料點的直線,且變異程度最小的參數https://chart.googleapis.com/chart?cht=tx&chl=a%2C%20b。變異程度以,https://chart.googleapis.com/chart?cht=tx&chl=F(a%2C%20b)%20%3D%20%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%20(y_i%20-%20(a%20%2B%20bt_i))%5E2表示。
    對上式做偏微分,https://chart.googleapis.com/chart?cht=tx&chl=%5Cfrac%7B%5Cpartial%20F%7D%7B%5Cpartial%20a%7Dhttps://chart.googleapis.com/chart?cht=tx&chl=%5Cfrac%7B%5Cpartial%20F%7D%7B%5Cpartial%20b%7D,並令其為0,可得
    https://chart.googleapis.com/chart?cht=tx&chl=%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%20y_i%20%3D%20na%20%2B%20b%20%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%20t_i
    https://chart.googleapis.com/chart?cht=tx&chl=%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%20t_i%20y_i%20%3D%20a%20%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%20t_i%20%2B%20b%20%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%20t_i%5E%7B2%7D
    解得https://chart.googleapis.com/chart?cht=tx&chl=a%2C%20b,帶回函數https://chart.googleapis.com/chart?cht=tx&chl=%5Chat%7By%7D_i%20%3D%20a%20%2B%20bt_i,最後代入狀態變數https://chart.googleapis.com/chart?cht=tx&chl=(t_i)便可計算出預測值
    最後,計算全部變化中由回歸線解釋的部分https://chart.googleapis.com/chart?cht=tx&chl=R%5E%7B2%7D%20%3D%20%5Cfrac%7B%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%20(%5Chat%7By%7D_i%20-%20%5Cbar%7By%7D)%5E2%7D%7B%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%20(y_i%20-%20%5Cbar%7By%7D)%5E2%7D
  4. 求解模型
    將表中的CM1數據,
    https://chart.googleapis.com/chart?cht=tx&chl=(t_1%2C%20y_1)%20%3D%20(1%2C%206.73)
    https://chart.googleapis.com/chart?cht=tx&chl=(t_2%2C%20y_2)%20%3D%20(2%2C%206.27)
    https://chart.googleapis.com/chart?cht=tx&chl=%5Cdots
    https://chart.googleapis.com/chart?cht=tx&chl=(t_37%2C%20y_37)%20%3D%20(37%2C%208.44)代入方程組求出https://chart.googleapis.com/chart?cht=tx&chl=a%2C%20b,得
    https://chart.googleapis.com/chart?cht=tx&chl=y%20%3D%205.45%20%2B%200.097t;https://chart.googleapis.com/chart?cht=tx&chl=R%5E2%20%3D%2083%25
    https://chart.googleapis.com/chart?cht=tx&chl=t%20%3D%2048代入
    https://chart.googleapis.com/chart?cht=tx&chl=%5CRightarrow%20E(X_48)%20%3D%205.45%20%2B%200.097%20*%2048%20%3D%2010.1
  5. 表達分析結果
    此回歸方程式說明了,1990年5月的CM1估計值為10.1,且解釋量高達83%,意即此估計值有很高的信心水準。
    透過此模型所擬合出來的結果如下圖
    https://ithelp.ithome.com.tw/upload/images/20190930/20119600GKXqyZyx6D.jpg

上一篇
Day 27 : 隨機模型 -- 馬可夫過程
下一篇
Day 29 : 隨機過程 -- 時間序列
系列文
連接數學與現實世界的橋樑 -- 數學建模30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言