在統計與機器學習中,我們建立出來的模型用來預測,會有兩種判斷誤差:偽陰性/偽陽性。
假如我們有一個臉部辨識的模型,能夠判斷相片中的內容是否包含人的頭部正面(臉部)。
那麼右上角的代表偽陰性,因為模型判斷為非人臉部內容(陰性),但其實是有的(偽)。
而左下角的代表偽陽性,因為模型判斷為有人臉部內容(陽性),但其實他是一個雕像(偽)。
這張圖應該會更好體會 XD。
在有些情況下,偽陽性會比較被我們接受。
生活中,疾病檢查/驗孕棒,如果被檢查出疾病/懷孕了(兩槓?!),我們可以選擇再去別間檢查一次/再拿別的廠牌驗一次,如果為陰性,代表第一次可能是誤差。但如果是偽陰性,我們並不太會想再檢查一次 XD,結果讓事情拖延直到來不及。
而 G社的臉部辨識模型應用在地圖街景服務也是。因為沒有把隱私的部分碼好碼滿,等到被民眾開吉的時候就得不償失了。所以他們寧願容忍偽陽性,把能碼的都碼起來。所以常常會看到有些地方連廣告看板的臉都馬賽克起來。