如下圖,為隨機模擬 100 次 Y 所呈現的特性。由 bar plot 可看出 Y 為右尾分布,且其中位數、第一與第四四分位數都靠得很近,又有許多 outliers 點。以上表示模擬出來的資料分布集中,但也有許多資料過度遠離中心。由機率圖可得出初步判斷結論:Y 沒有符合標準常態分配。
假設有兩個隨機變數 X1 ~ chi^2(df1), X2 ~ chi^2(df2),而隨機變數 Y = X1 + X2。理論上若 X1 與 X2 獨立,則 Y ~ chi^2(df1+df2)。此處呈現此理論在不同樣本數 n 下的分布情況。
下圖為 X1 ~ chi^2(df1=2), X2 ~ chi^2(df2=6) 之下,不同樣本數 n = 100, 1000, 10000 的直方圖,紅線為 Y ~ chi^2(df1+df2=8) 的 PDF 。發現隨 n 增加,直方圖越靠近 chi^2(8) 的 PDF,亦即越靠近理論上的兩獨立卡方相加後的分配。
Python 程式碼如下