iT邦幫忙

2021 iThome 鐵人賽

DAY 14
0
自我挑戰組

開卷計劃:做一個高手夢系列 第 14

如何衡量萬事萬物 (8) 觀察少數

  • 分享至 

  • twitterImage
  •  

建立直覺

題目

小實驗:請問一粒果凍豆的平均重量是多少公克?請回答你的 90% CI。

Untitled

請寫下你的範圍,並運用相等賭局做測試。再想一想這個範圍為什麼是合理的,包括正反雙方的意見,然後對上、下限都做定錨測試。

開始抽樣

1

接下來我們抽出第一顆果凍豆,重點是 1.4 公克。

這會改變你的 90% CI 嗎?更新後的 CI 是什麼?

2

再下一個樣本是 1.5 公克。你會重新更新你的 CI 嗎?

3

接下來我們一口氣抽出三個隨機樣本:1.4 公克、1.6 公克、1.1 公克

請更新 CI。

4

最後再抽三個:1.5 公克、0.9 公克、1.7 公克。

至此有 8 個樣本。請決定最後的 CI。

討論

就算第一次寫了極寬的範圍,每次獲得新資料以後,範圍通常都會縮小一次。

作者的實測中,最初範圍最窄的是 1~3 公克,而最寬的是 0.5~50 公克。

提出 0.5~50 公克的受測者,在「第一個樣本」出現後,將範圍變成 0.5~6 公克。

最後,這袋果凍豆的實際平均約為 1.45 公克。

作者建議大家可以常常進行類似的練習,在不依賴「正規統計學」的情況下,進行主觀的估計,培養估算的直覺。

教科書作法

接著針對同一個問題,在教科書裡有一個數學式的作法,可以針對「樣本數很少」的情況,來進行小樣本的統計。

接下來我們選出果凍豆的前 5 個樣本:1.4, 1.4, 1.5, 1.6, 1.1 來進行。

此方法稱為 t 統計量 (t-statistic),在樣本數少於 30 的情況下,分配的形狀會比常態分配平坦、寬長,而樣本數超過 30 以後,t 統計的形狀和常態分配一樣。

以下是一個計算母體平均 90% CI 的固定程序:

  1. 計算樣本的「變異數」。也就是對於每個樣本的變異程度予以數量化
    1. 計算樣本的平均 (1.4 + 1.4 + 1.5 + 1.6 + 1.1) / 5 = 1.4
    2. 每個樣本減去這個平均,每個結果作平方
      • (1.4 - 1.4)^2 = 0
      • (1.5 - 1.4)^2 = 00.1
      • (1.6 - 1.4)^2 = 00.4
      • (1.1 - 1.4)^2 = 00.9
    3. 將所有的平方加總後,除以樣本數減 1
      (0 + 0 + 0.01 + 0.04 + 0.09) / (5 - 1) = 0.035
  2. 將樣本變異數除以樣本數,再將結果開平方根 SQRT(0.035 / 5) ⇒ 0.0837
  3. 從 t 分配模型中找到樣本數 5 的分數 → 2.13
  4. 將 t 分配量乘以步驟 2 的答案 2.13 x 0.0837 = 0.178,這是樣本誤差
  5. 將平均加上樣本誤差,就得到 90% CI 上限,減去誤差則得到下限 1.222~ 1.578

如此一來只需要 5 個樣本,就獲得一個 1.22~ 1.58 的範圍。

討論:主觀方法 v.s. 客觀方法

在最初的果凍豆實驗中,作者邀請受測者用主觀的方法直覺估算,這些受測者都受過校準估計,

  • 最保守的估計者得到的範圍是:0.5~2.4
  • 最有信心的人的範圍是:1~1.7
  • 而 t 分配的範圍是:1.22~1.58

教科書的作法雖然較為客觀,但在此想討論的是,主觀方法也頗有效。多做一些數學,只是比靠校準估計進一步降低誤差。

總結

  • 當你有很大的不確定性時,少量的樣本就能大幅降低不確定性,尤其是當母體是相對同質性時
  • 在某些案例中,校準的估計者即使只靠一個樣本,也能降低不確定性
  • 校準估計者雖然比較保守,但卻是合理的。多做一些數學能更進一步降低不確定性

203/393

今天押線交啦~~


上一篇
如何衡量萬事萬物 (7) 誤差
下一篇
如何衡量萬事萬物 (9) 偏好與態度
系列文
開卷計劃:做一個高手夢30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言