【Day 14】How Google does Machine Leaning(Inclusive ML-2)

11th鐵人賽

david111esc

2019-09-15 23:47:22

1304 瀏覽

分享至

前言

連假最後一天，讓人憂鬱的難以動筆。

主題

3.1 Evaluating Metrics for Inclusion

這章節重點就介紹如何使用混淆矩陣(confusion matrix)來檢驗模型的好壞，這個矩陣在於二元分類的問題中，能夠非常有效的反映模型各方面的能力強弱，讓我們根據使用場景進行取捨與調整。
如圖，這個矩陣能夠分成四大區塊，每塊區域都是針對實際標籤(Label)與模型預測(Prediction)的一種交互關係，利用這樣的交互關係，檢驗模型在資料集上的表現。
首先，在Label的部分我們分成顯性(Positive)與隱性(Negative)。一般而言，我們會將要檢測的目標當作顯性，例如，疾病檢測的時候，帶有疾病是我們所想要檢測出的目標，因此，顯性(Positive)就會代表患有該疾病，而隱性(Negative)則是正常人;又或者今天想要訓練一款貓貓檢驗機來判斷圖像內是否有貓咪，那麼"有貓咪"是我們主要目標，因此，就會被歸類為顯性。
接著，當實際Label與模型預測的結果進行交互後，產生四個區塊:

True Postive(TP):

針對顯性的資料，模型預測正確，代表著有成功檢測出目標，此數值的比例越高，模型的表現也會隨之提升，是影響模型的重要數值。

True Negative(TN):

針對隱性的資料，模型預測正確，但通常比起True Positive，這項的影響力相對較低，因為隱性的資料通常比較不會是我們所關心的。

False Postive(FP):

假顯性，這項代表實際為隱性的資料，被模型錯誤判別成顯性了，又稱作"Type 1 Error"。
對於那種寧可錯殺一百也不能放過一人的模型而言，此類型的錯誤殺傷力較低，舉例而言，醫療疾病的檢測，當你被錯誤當作有癌症的時候，或許進一步精密的檢測就能排除，但若是有癌症的人沒被檢測出來，造成的代價卻是非常大的。

False Negative(FN):

假隱性，這項代表實際為顯性的資料，被模型錯誤判別成隱性了，又稱作"Type 2 Error"。
這是在醫療檢測中首要降低的數值，但對於某些情境，例如:工廠產線的檢測，由於生產流程中會有多道檢測手續，所以此項數值稍微高一點或許無傷大雅，後面仍會有機會檢測出來，但若是FP過高，常常產生False alarm，在自動化流程中會造成生產速度拖緩，降低產品產量，故在此情境下就會需要在FP與FN之間取得平衡。