上一篇介紹了統計分佈和統計檢定的基本概念,
但有一些地方有寫錯,請大家要看一下修正喔~
接著這篇要我們要來更深入地介紹統計檢定啦!
正如上一篇所說的,
統計檢定的基本精神是去看一個東西和另一個東西的差異,
在統計分佈上面是不是屬於比較不可能發生的情況。
如果是的話就代表他的差異顯著。
在正式的推論統計上,
我們會用「虛無假設(Null Hypothesis, H0)」和
「對立假設(Alternative Hypothesis, H1)」這兩個詞。
前者是指沒有差的情況,後者是有差的情況。
而我們在統計檢定上面其實目標是要拒絕虛無假設
(沒有差的這件事情不是正確的=>有差)。
這可能有點難理解,我們舉個例子來說好了。
以上篇那個AI推薦文章的例子,我們的虛無假設會是
「AI推薦的文章跟隨機的文章有用度一樣」,
對立假設則是「AI推薦的文章跟隨機的文章有用度不同」
對立假設其實還可以分成兩個方向,
一個是「AI推薦的文章比隨機的文章有用」,
另一個則是「AI推薦的文章比隨機的文章沒用」。
當我們做假設檢定的時候,如果統計差異顯著,
那我們就是推翻虛無假設,
這時候我們要去看那個差異實際上落在分佈哪一側的極端,
再來判斷它實際上支持的是對立假設的哪個方向。
統計檢定最基本的檢定是Z檢定,也就是基於常態分佈的檢定。
他的基本精神就是去跟一個固定值比,
例如我們可以假設台灣人的身高平均值為155,
然後去做抽樣,算出平均值跟標準差,
再用Z檢定去看這個算出來的平均值,
是不是跟155這個數字的差異,在常態分佈上呈現較不可能的狀態,
假設他是差異顯著且平均值大於155,
那麼我們可以說台灣人平均身高顯著大於155,
如果平均值是小於155,
那我們就可以反過來說是平均身高顯著小於155。
要做統計檢定其實是需要符合一些前提的。
在簡介這些前提前,我們先回頭介紹兩個詞:
「獨立變項」和「依變項」。
在實驗設計那篇我們有提到控制變因跟操作變因,
以及對應的目標測量值。
在統計檢定我們會用「獨立變項」來指操作變因,
「依變項」來指目標測量值,
控制變因則不會明確指出,
因為控制變因在不同的組或條件中,理論上是一樣的。
以Z檢定來說,我們需要符合的前提有:
上面的幾個前提,最困難的就是第四點,
因為我們實際上很難知道母體實際的變異數為何,
樣本又不一定總是可以收到這麼多,
這種時候我們會選擇使用t檢定,
而這也是人機互動最常用的幾種檢定之一。
下一篇再讓我們仔細介紹t檢定吧~