如果你要量體重,在以下兩個情況中,你會選擇何者:
- 一個「已校準過」的體重計,也就是能反映真實的體重,但是放在移動中的露營車上,每次測量時,會因為汽車的顛簸而受到干擾。
- 一個「沒有被校準過」的體重計,但放在良好的環境中,每次測量時不會受到干擾
和誤差有關的名詞
這個段落在討論「如何看待『誤差』」,在討論前,作者先釐清了相關的名詞。
誤差有兩大類型
-
系統性誤差 / 偏誤 (systemic error/ bias)
- 衡量本身有一個傾向,會偏向某個特定結果
- 這個偏向是有一致性的
-
隨機誤差 (random error)
- 無法透過個別觀察來預測誤差
- 不具一致性,和已知的變數無關
- 但這類誤差在大群體中,會遵守機率法則
例如,銷售員在估算下一季營收時,會例行性高估 50%,這是系統性誤差;而若非每次都是高估 50%,就是隨機誤差。
誤差的特質
想要表達「誤差的特質」時,要釐清以下兩個詞:
-
正確性 (accuracy)
- 衡量結果「有多接近真實」
- 系統性誤差愈小,正確性愈高
-
準確性 (precision)
- 多次衡量是否能達到一致的結果,也就是衡量的可複製性 (reporducibility) & conformity
- 隨機性誤差愈小,準確性愈高
回到體重計的舉例,
- 如果放在浴室裡的體重計被固定調高 2 公斤 → 它是準確的,但不是正確的
- 此時,precise 的意思是,每次你上去量體重,都會得到一致的答案,但這個答案不等於你的真實體重
- 若你知道體重計「被固定調高 2 公斤」的資訊,才能獲得真實體重
- 放在露營車上、校準過的體重計 → 正確性好,但準確性低
- 你在一分鐘內量了兩次,會得到不同的答案
- 但多次測量後,平均答案會接近真正的體重
任何降低兩種誤差的方法都稱為「對照控制」。
為什麼要選擇準確性高的衡量?
回到一開始的問題:
- 一個「已校準過」的體重計,也就是能反映真實的體重,但是放在移動中的露營車上,每次測量時,會因為汽車的顛簸而受到干擾。
- 一個「沒有被校準過」的體重計,但放在良好的環境中,每次測量時不會受到干擾
在此例中,作者認為,比較好的選擇是 1,因為 1 可以透過多次測量的平均來獲得一個可信賴的範圍,而 2 的誤差是未知的。除非你知道體重計被調高或調低的資訊,否則永遠無法獲得真實體重。
然而,作者表示,在真實情境中,絕大多數人會傾向採用模式 2。
例如,企業想要知道「銷售員花多少時間與客戶開會,又花多少時間在其他行政事務上」。
- 實務上常常看到的作法是 → 檢視工作時間記錄卡
- 而「工作時間記錄卡」是有誤差的,因為人們常常在下班時匆匆忙忙地填表,有些人習慣高估、而另一些人習慣低估
- 全面檢視工作時間記錄卡以後,假設有 5000 份紀錄卡、100 名銷售員、50 個星期,會得知
銷售員有 34% 時間花在與顧客溝通上
- 我們獲得了一個確切的數值,但是不知道這個數值和真實狀況的距離為例
另一種作法
- 在隨機選取的時間,隨機選擇一名銷售員,看看他是否正在開會
- 隨機抽樣 100 次之後,發現有 13 件正在開會中
- 此時,若具備對抽樣統計的知識,可以獲得 90% CI 的範圍是 →
銷售員有 7.5%~18.5% 時間花在與顧客溝通上
在這兩種結論中,你認為哪個較可信?
觀察偏誤 (bias) 的種類
- 預期性偏誤
- 只看到你想要的,也就是自我欺騙
- 在新藥臨床試驗中,醫師和病人都不可以知道誰服用了安慰劑
- 選擇性偏誤
- 在抽樣調查時,雖然知道要隨機,但發生了「沒有注意到的非隨機性」
- 例如,在金融特區的街道上隨機問路人,他們要投票給哪一位候選人
- 觀察者偏誤
- 在觀察的過程中,因為「觀察」這個動作,導致人們改變行為
- 在某次研究計劃中,想要調查環境照明 & 濕度對生產力的影響,結果發現,無論做了什麼變動,生產力都會進步,最後的假設是 → 管理階層對勞工有興趣這件事,導致勞工有正面反應
- 解決之道是:不要讓被觀察者知道他們正在被觀察
目前進度:193/393
昨天整理的是 CH8 的開頭,今天整理的是 CH8 的結尾。中間省略的是對「分解」和「間接研究」的介紹,這兩個 keyword 比較是實踐的問題,作者做了一些舉例來告訴大家「沒有你們想像得那麼麻煩」,總之我跳過了。
本來想直接進 CH9,但 CH9 要講抽樣,會和「誤差」的概念有銜接,回頭補上這一段。
每次讀到一些⋯天書段落時 (我在摘要時有選擇性跳過天書段 XD),我常有種「我到底為什麼還要看下去,其實不太會真的用到,不是嗎」的糾結,但每次遇到這種糾結時,我就試著回想「開卷計劃」的初衷,單純地想找回閱讀的樂趣,不要預期讓自己變得更厲害,不要預期某件手邊任務能立刻變順利,不帶預期地保持動作,尋求動作本身的樂趣,而不是尋求有好處的結果。
大概就是每天要做類似的心理建設,才能繼續進行下去。總之,很高興又過了一天。