iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 13
0
Software Development

在AI的時代追求人性系列 第 13

人機互動之推論統計簡介(2):虛無假設與對立假設以及Z檢定

  • 分享至 

  • xImage
  •  

上一篇介紹了統計分佈和統計檢定的基本概念,
但有一些地方有寫錯,請大家要看一下修正喔~

接著這篇要我們要來更深入地介紹統計檢定啦!

正如上一篇所說的,
統計檢定的基本精神是去看一個東西和另一個東西的差異,
在統計分佈上面是不是屬於比較不可能發生的情況。
如果是的話就代表他的差異顯著。

在正式的推論統計上,
我們會用「虛無假設(Null Hypothesis, H0)」和
「對立假設(Alternative Hypothesis, H1)」這兩個詞。
前者是指沒有差的情況,後者是有差的情況。
而我們在統計檢定上面其實目標是要拒絕虛無假設
(沒有差的這件事情不是正確的=>有差)。

這可能有點難理解,我們舉個例子來說好了。
以上篇那個AI推薦文章的例子,我們的虛無假設會是
「AI推薦的文章跟隨機的文章有用度一樣」,
對立假設則是「AI推薦的文章跟隨機的文章有用度不同」
對立假設其實還可以分成兩個方向,
一個是「AI推薦的文章比隨機的文章有用」,
另一個則是「AI推薦的文章比隨機的文章沒用」。

當我們做假設檢定的時候,如果統計差異顯著,
那我們就是推翻虛無假設,
這時候我們要去看那個差異實際上落在分佈哪一側的極端,
再來判斷它實際上支持的是對立假設的哪個方向。

統計檢定最基本的檢定是Z檢定,也就是基於常態分佈的檢定。
他的基本精神就是去跟一個固定值比,
例如我們可以假設台灣人的身高平均值為155,
然後去做抽樣,算出平均值跟標準差,
再用Z檢定去看這個算出來的平均值,
是不是跟155這個數字的差異,在常態分佈上呈現較不可能的狀態,
假設他是差異顯著且平均值大於155,
那麼我們可以說台灣人平均身高顯著大於155,
如果平均值是小於155,
那我們就可以反過來說是平均身高顯著小於155。

要做統計檢定其實是需要符合一些前提的。
在簡介這些前提前,我們先回頭介紹兩個詞:
「獨立變項」和「依變項」。

在實驗設計那篇我們有提到控制變因跟操作變因,
以及對應的目標測量值。
在統計檢定我們會用「獨立變項」來指操作變因,
「依變項」來指目標測量值,
控制變因則不會明確指出,
因為控制變因在不同的組或條件中,理論上是一樣的。

以Z檢定來說,我們需要符合的前提有:

  1. 依變項必須是連續變數
    (就是不可以像骰子那樣是離散的數值,離散數值的檢定有其他選擇)
  2. 抽樣的樣本必須是獨立的,也就是不會重複抽到同一個樣本。
  3. 抽象的母體本身必須是常態分配
  4. 母體的變異數必須是已知,或是樣本數得夠大(n>30)

上面的幾個前提,最困難的就是第四點,
因為我們實際上很難知道母體實際的變異數為何,
樣本又不一定總是可以收到這麼多,
這種時候我們會選擇使用t檢定,
而這也是人機互動最常用的幾種檢定之一。

下一篇再讓我們仔細介紹t檢定吧~


上一篇
人機互動之推論統計簡介(1):統計分佈與統計檢定基本概念
下一篇
人機互動之推論統計簡介(3):常態分佈、t分佈與t檢定
系列文
在AI的時代追求人性30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言