iT邦幫忙

2021 iThome 鐵人賽

DAY 17
0
自我挑戰組

開卷計劃:做一個高手夢系列 第 17

如何衡量萬事萬物 (10) 人的判斷

  • 分享至 

  • xImage
  •  

(續上)

無變異比較 & 拉許模型

教育評量的領域,對「能力」有大量的衡量需求。其中有一個值得借鑑的概念是「無變異比較 (invariant comparison)。

基本概念是:

  • 如果第一項衡量工具中,發現 A 比 B 多
  • 使用另一個工具,仍然要得到 A 比 B 多

聽起來是不是講廢話 XD,等於用兩個體重計量體重,答案應相同。不過在 IQ 測驗中,常常發生上述問題,例如第一次測量,甲的 IQ 高於 乙,換了一個工具後,乙的 IQ 就高於甲。

在商業的場景中,則可以對應到面試或衡量專案績效時,會因為審查官「是否嚴格」或專案的的困難程度,會產生很大的落差,此時我們就會說這個狀況的「無變異」不成立。

在 1961 年 Georg Rasch 提出了一個解決方案,可以來預測「答對是非題」的機率。

根據

  • 母體中其他受測者答對同一題的比率
  • 以及此受測者答對其他問題的比率

步驟

  • 先挑一個題目
  • 從回答問題的人當中,答對者的比率,可定義出「題目困難度」
    • → 例如 65% 代表只有 35% 的人答對
    • 計算該機率的對數勝算 (log-odds),在這裡就是自然對數
    • 例如答錯的比率是 0.548,他的自然對數為 -0.619
    • Excel 公式 ln(P(a)/ (1-P(a))P(a) 是答對題目的機率
  • 計算目標受測者答對所有問題的機率,例如 82%
    • In (0.82 / 0.18) = 1.52
  • 將兩個對數相加 -0.619 + 1.52 = 0.9
    • 將此轉換回機率,使用 Excel 公式 1/ (1 / exp (0.9) +1
    • 結果為 71%

這裡的意義是,「受測者有 71% 會答對該題目」

這個模型有兩個前提:

  • 題目困難度是已知的
  • 也需要知道「受測者在其他題目上的表現」

實際應用的例子

美國臨床病理學會的認證:

  • 每位候選人都被指派一個或多項個案,由評審審查
  • 個案難度不一致,評審嚴格程度也不一致
  • 統計學家先制定標準拉計分數,包括:
    • 每個評審
    • 個案
    • 每項技術類別的候選人
  • 接著就能預測候選人在「平均的評審 & 平均的個案」下是否能通過

衡量閱讀能力

  • 另一個根據拉許模型的改造框架 - Lexile Framework
  • 用來評審閱讀及寫作困難度
  • 美國的許多教科書的閱讀進度表會以 Lexile 分級來架構

(...............最後還有一個 chapter,我讀完了,但已失去了摘要的能量,就結束在今天吧orz)


上一篇
如何衡量萬事萬物 (10) 人的判斷
下一篇
勒瑰恩談寫作 (1) 文法與句子
系列文
開卷計劃:做一個高手夢30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 則留言

0
TD
iT邦新手 4 級 ‧ 2021-10-09 13:39:44

書中 Georg Rasch 提出的是這個理論嗎?https://zh.wikipedia.org/zh-tw/%E9%A1%B9%E7%9B%AE%E5%8F%8D%E5%BA%94%E7%90%86%E8%AE%BA

我要留言

立即登入留言