iT邦幫忙

2021 iThome 鐵人賽

DAY 13
0
自我挑戰組

開卷計劃:做一個高手夢系列 第 13

如何衡量萬事萬物 (7) 誤差

如果你要量體重,在以下兩個情況中,你會選擇何者:

  1. 一個「已校準過」的體重計,也就是能反映真實的體重,但是放在移動中的露營車上,每次測量時,會因為汽車的顛簸而受到干擾。
  2. 一個「沒有被校準過」的體重計,但放在良好的環境中,每次測量時不會受到干擾

和誤差有關的名詞

這個段落在討論「如何看待『誤差』」,在討論前,作者先釐清了相關的名詞。

誤差有兩大類型

  • 系統性誤差 / 偏誤 (systemic error/ bias)
    • 衡量本身有一個傾向,會偏向某個特定結果
    • 這個偏向是有一致性的
  • 隨機誤差 (random error)
    • 無法透過個別觀察來預測誤差
    • 不具一致性,和已知的變數無關
    • 但這類誤差在大群體中,會遵守機率法則

例如,銷售員在估算下一季營收時,會例行性高估 50%,這是系統性誤差;而若非每次都是高估 50%,就是隨機誤差。

誤差的特質

想要表達「誤差的特質」時,要釐清以下兩個詞:

  • 正確性 (accuracy)
    • 衡量結果「有多接近真實」
    • 系統性誤差愈小,正確性愈高
  • 準確性 (precision)
    • 多次衡量是否能達到一致的結果,也就是衡量的可複製性 (reporducibility) & conformity
    • 隨機性誤差愈小,準確性愈高

回到體重計的舉例,

  • 如果放在浴室裡的體重計被固定調高 2 公斤 → 它是準確的,但不是正確的
    • 此時,precise 的意思是,每次你上去量體重,都會得到一致的答案,但這個答案不等於你的真實體重
    • 若你知道體重計「被固定調高 2 公斤」的資訊,才能獲得真實體重
  • 放在露營車上、校準過的體重計 → 正確性好,但準確性低
    • 你在一分鐘內量了兩次,會得到不同的答案
    • 但多次測量後,平均答案會接近真正的體重

任何降低兩種誤差的方法都稱為「對照控制」。

為什麼要選擇準確性高的衡量?

回到一開始的問題:

  1. 一個「已校準過」的體重計,也就是能反映真實的體重,但是放在移動中的露營車上,每次測量時,會因為汽車的顛簸而受到干擾。
  2. 一個「沒有被校準過」的體重計,但放在良好的環境中,每次測量時不會受到干擾

在此例中,作者認為,比較好的選擇是 1,因為 1 可以透過多次測量的平均來獲得一個可信賴的範圍,而 2 的誤差是未知的。除非你知道體重計被調高或調低的資訊,否則永遠無法獲得真實體重。

然而,作者表示,在真實情境中,絕大多數人會傾向採用模式 2。

例如,企業想要知道「銷售員花多少時間與客戶開會,又花多少時間在其他行政事務上」。

  • 實務上常常看到的作法是 → 檢視工作時間記錄卡
  • 而「工作時間記錄卡」是有誤差的,因為人們常常在下班時匆匆忙忙地填表,有些人習慣高估、而另一些人習慣低估
  • 全面檢視工作時間記錄卡以後,假設有 5000 份紀錄卡、100 名銷售員、50 個星期,會得知銷售員有 34% 時間花在與顧客溝通上
  • 我們獲得了一個確切的數值,但是不知道這個數值和真實狀況的距離為例

另一種作法

  • 在隨機選取的時間,隨機選擇一名銷售員,看看他是否正在開會
  • 隨機抽樣 100 次之後,發現有 13 件正在開會中
  • 此時,若具備對抽樣統計的知識,可以獲得 90% CI 的範圍是 → 銷售員有 7.5%~18.5% 時間花在與顧客溝通上

在這兩種結論中,你認為哪個較可信?

觀察偏誤 (bias) 的種類

  • 預期性偏誤
    • 只看到你想要的,也就是自我欺騙
    • 在新藥臨床試驗中,醫師和病人都不可以知道誰服用了安慰劑
  • 選擇性偏誤
    • 在抽樣調查時,雖然知道要隨機,但發生了「沒有注意到的非隨機性」
    • 例如,在金融特區的街道上隨機問路人,他們要投票給哪一位候選人
  • 觀察者偏誤
    • 在觀察的過程中,因為「觀察」這個動作,導致人們改變行為
    • 在某次研究計劃中,想要調查環境照明 & 濕度對生產力的影響,結果發現,無論做了什麼變動,生產力都會進步,最後的假設是 → 管理階層對勞工有興趣這件事,導致勞工有正面反應
    • 解決之道是:不要讓被觀察者知道他們正在被觀察

目前進度:193/393

昨天整理的是 CH8 的開頭,今天整理的是 CH8 的結尾。中間省略的是對「分解」和「間接研究」的介紹,這兩個 keyword 比較是實踐的問題,作者做了一些舉例來告訴大家「沒有你們想像得那麼麻煩」,總之我跳過了。

本來想直接進 CH9,但 CH9 要講抽樣,會和「誤差」的概念有銜接,回頭補上這一段。

每次讀到一些⋯天書段落時 (我在摘要時有選擇性跳過天書段 XD),我常有種「我到底為什麼還要看下去,其實不太會真的用到,不是嗎」的糾結,但每次遇到這種糾結時,我就試著回想「開卷計劃」的初衷,單純地想找回閱讀的樂趣,不要預期讓自己變得更厲害,不要預期某件手邊任務能立刻變順利,不帶預期地保持動作,尋求動作本身的樂趣,而不是尋求有好處的結果。

大概就是每天要做類似的心理建設,才能繼續進行下去。總之,很高興又過了一天。


上一篇
如何衡量萬事萬物 (6) 衡量工具
下一篇
如何衡量萬事萬物 (8) 觀察少數
系列文
開卷計劃:做一個高手夢30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 則留言

0
TD
iT邦新手 4 級 ‧ 2021-09-28 23:52:10

單純地想找回閱讀的樂趣

閱讀本身是一件很有趣的事情,可以跟作者交流、也可以跟自己聊天。我過去看過一堆書內容大概都忘了差不多了,但我想過程中的的那些刺激,多多少少的形塑了、累積成了現在的我的思考方式

我要留言

立即登入留言