如何衡量萬事萬物 (7) 誤差

2021 iThome 鐵人賽

DAY 13

自我挑戰組

開卷計劃：做一個高手夢系列第 13 篇

13th鐵人賽

Ellen Lee

團隊Outcome First 2.0

2021-09-28 22:52:09

1144 瀏覽

分享至

如果你要量體重，在以下兩個情況中，你會選擇何者：

一個「已校準過」的體重計，也就是能反映真實的體重，但是放在移動中的露營車上，每次測量時，會因為汽車的顛簸而受到干擾。
一個「沒有被校準過」的體重計，但放在良好的環境中，每次測量時不會受到干擾

和誤差有關的名詞

這個段落在討論「如何看待『誤差』」，在討論前，作者先釐清了相關的名詞。

誤差有兩大類型

系統性誤差 / 偏誤 (systemic error/ bias)
- 衡量本身有一個傾向，會偏向某個特定結果
- 這個偏向是有一致性的
隨機誤差 (random error)
- 無法透過個別觀察來預測誤差
- 不具一致性，和已知的變數無關
- 但這類誤差在大群體中，會遵守機率法則

例如，銷售員在估算下一季營收時，會例行性高估 50%，這是系統性誤差；而若非每次都是高估 50%，就是隨機誤差。

誤差的特質

想要表達「誤差的特質」時，要釐清以下兩個詞：

正確性 (accuracy)
- 衡量結果「有多接近真實」
- 系統性誤差愈小，正確性愈高
準確性 (precision)
- 多次衡量是否能達到一致的結果，也就是衡量的可複製性 (reporducibility) & conformity
- 隨機性誤差愈小，準確性愈高

回到體重計的舉例，

如果放在浴室裡的體重計被固定調高 2 公斤 → 它是準確的，但不是正確的
- 此時，precise 的意思是，每次你上去量體重，都會得到一致的答案，但這個答案不等於你的真實體重
- 若你知道體重計「被固定調高 2 公斤」的資訊，才能獲得真實體重
放在露營車上、校準過的體重計 → 正確性好，但準確性低
- 你在一分鐘內量了兩次，會得到不同的答案
- 但多次測量後，平均答案會接近真正的體重

任何降低兩種誤差的方法都稱為「對照控制」。

為什麼要選擇準確性高的衡量？

回到一開始的問題：

一個「已校準過」的體重計，也就是能反映真實的體重，但是放在移動中的露營車上，每次測量時，會因為汽車的顛簸而受到干擾。
一個「沒有被校準過」的體重計，但放在良好的環境中，每次測量時不會受到干擾

在此例中，作者認為，比較好的選擇是 1，因為 1 可以透過多次測量的平均來獲得一個可信賴的範圍，而 2 的誤差是未知的。除非你知道體重計被調高或調低的資訊，否則永遠無法獲得真實體重。

然而，作者表示，在真實情境中，絕大多數人會傾向採用模式 2。

例如，企業想要知道「銷售員花多少時間與客戶開會，又花多少時間在其他行政事務上」。

實務上常常看到的作法是 → 檢視工作時間記錄卡
而「工作時間記錄卡」是有誤差的，因為人們常常在下班時匆匆忙忙地填表，有些人習慣高估、而另一些人習慣低估
全面檢視工作時間記錄卡以後，假設有 5000 份紀錄卡、100 名銷售員、50 個星期，會得知銷售員有 34% 時間花在與顧客溝通上
我們獲得了一個確切的數值，但是不知道這個數值和真實狀況的距離為例

另一種作法

在隨機選取的時間，隨機選擇一名銷售員，看看他是否正在開會
隨機抽樣 100 次之後，發現有 13 件正在開會中
此時，若具備對抽樣統計的知識，可以獲得 90% CI 的範圍是 → 銷售員有 7.5%~18.5% 時間花在與顧客溝通上

在這兩種結論中，你認為哪個較可信？

觀察偏誤 (bias) 的種類

預期性偏誤
- 只看到你想要的，也就是自我欺騙
- 在新藥臨床試驗中，醫師和病人都不可以知道誰服用了安慰劑
選擇性偏誤
- 在抽樣調查時，雖然知道要隨機，但發生了「沒有注意到的非隨機性」
- 例如，在金融特區的街道上隨機問路人，他們要投票給哪一位候選人
觀察者偏誤
- 在觀察的過程中，因為「觀察」這個動作，導致人們改變行為
- 在某次研究計劃中，想要調查環境照明 & 濕度對生產力的影響，結果發現，無論做了什麼變動，生產力都會進步，最後的假設是 → 管理階層對勞工有興趣這件事，導致勞工有正面反應
- 解決之道是：不要讓被觀察者知道他們正在被觀察

目前進度：193/393

昨天整理的是 CH8 的開頭，今天整理的是 CH8 的結尾。中間省略的是對「分解」和「間接研究」的介紹，這兩個 keyword 比較是實踐的問題，作者做了一些舉例來告訴大家「沒有你們想像得那麼麻煩」，總之我跳過了。

本來想直接進 CH9，但 CH9 要講抽樣，會和「誤差」的概念有銜接，回頭補上這一段。

每次讀到一些⋯天書段落時 (我在摘要時有選擇性跳過天書段 XD)，我常有種「我到底為什麼還要看下去，其實不太會真的用到，不是嗎」的糾結，但每次遇到這種糾結時，我就試著回想「開卷計劃」的初衷，單純地想找回閱讀的樂趣，不要預期讓自己變得更厲害，不要預期某件手邊任務能立刻變順利，不帶預期地保持動作，尋求動作本身的樂趣，而不是尋求有好處的結果。

大概就是每天要做類似的心理建設，才能繼續進行下去。總之，很高興又過了一天。