iT邦幫忙

2024 iThome 鐵人賽

DAY 15
0
AI/ ML & Data

藉由 Python 介紹統計學與機器學習系列 第 15

Day 15:【統計概念-7】抽樣分配 &卡方分配

  • 分享至 

  • xImage
  •  

標準常態分配的平方

  • 目標:欲驗證 $Y = Z^2$ 是否服從 $\chi^2(1)$ 分配,其中 $Z$ 為標準常態分配,即 $Z \sim N(0, 1)$。

如下圖,為隨機模擬 100 次 Y 所呈現的特性。由 bar plot 可看出 Y 為右尾分布,且其中位數、第一與第四四分位數都靠得很近,又有許多 outliers 點。以上表示模擬出來的資料分布集中,但也有許多資料過度遠離中心。由機率圖可得出初步判斷結論:Y 沒有符合標準常態分配。

卡方加卡方

假設有兩個隨機變數 X1 ~ chi^2(df1), X2 ~ chi^2(df2),而隨機變數 Y = X1 + X2。理論上若 X1 與 X2 獨立,則 Y ~ chi^2(df1+df2)。此處呈現此理論在不同樣本數 n 下的分布情況。

下圖為 X1 ~ chi^2(df1=2), X2 ~ chi^2(df2=6) 之下,不同樣本數 n = 100, 1000, 10000 的直方圖,紅線為 Y ~ chi^2(df1+df2=8) 的 PDF 。發現隨 n 增加,直方圖越靠近 chi^2(8) 的 PDF,亦即越靠近理論上的兩獨立卡方相加後的分配。

Python 程式碼如下


上一篇
Day 14:【統計概念-6】抽樣分配 & 中央極限定理 CLT
下一篇
Day 16:【統計概念-8】線性回歸模型 -- Simple Linear Regression
系列文
藉由 Python 介紹統計學與機器學習31
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言