[30]Confusion Matrix - 用來衡量Classifier Model的方式 Precision和Recall - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2019 iT 邦幫忙鐵人賽

DAY 30

Everything on Azure

使用 Microsoft Conversational AI Tools - 打造新时代的UI界面系列第 30 篇

[30]Confusion Matrix - 用來衡量Classifier Model的方式 Precision和Recall

2019鐵人賽 botframework chatbot

Alan Tsai

2018-11-14 23:58:51

8477 瀏覽

分享至

在上一篇([29]維護Custon Vision Model - 使用歷史查詢記錄做訓練以及如何版控)看完了如何用歷史的搜索結果來持續training Model(模型)并且透過iteration做到Model的測試訓練以及版控，不過上一篇也遺留了一個問題，怎麽看目前的Model是好還是壞？

這裡面就牽扯到了一些數學概念，因此在這一篇將介紹怎麽評判一個Classifier Model是好還是壞，透過Confusion Matrix以及Precision和Recall來瞭解一個Classifier Model的情況。

背景介紹
到目前爲止所使用的Custom Vision服務其實在建立的是所謂的Classifier Model，也就是所謂的分類型的模型。

Classifier Model主要作用是判斷某個傳入的資料是不是屬於某個分類。白話一點來説，假設我有個判斷照片是不是狗的模型，那麽只會有可能是是和不是。

當然上面給的例子是一種分類而已，但是模型可能有好多種類來判別。爲了讓接下來不那麽複雜，將會只有一類的來介紹。

有了這個背景介紹了之後，來看看怎麽看一個Model的準確率。

怎麽計算Model準確度？Confusion Matrix介紹
當只有一類的額情況下，用Model判斷一張圖片只有可能是四種結果：

True Positive (TP)
Model判斷圖片屬於狗，并且實際上這張圖片是狗。
True Negative (TN)
Model 判斷圖片不屬於狗，并且實際上這張圖片不是狗。
False Positive (FP)
Model 判斷圖片屬於狗，但是實際上這張圖片不是狗。
False Negative (FN)
Model判斷圖片不屬於狗，但是實際上這張圖片是狗。
這四種結果可以畫成一張表，也就是所謂的Confusion Matrix：

Model判斷是狗 Model判斷不是狗
實際是狗 TP FN
實際不是狗 FP TN
如果把數字填上去就會變成：

Model判斷是狗 Model判斷不是狗
實際是狗 5 2
實際不是狗 1 6
計算準確度
既然把表建立出來了之後，接下來就看看從數學角度怎麽計算，這邊介紹3種：

Accuracy
Recall
Precision
Accuracy
Accuracy是日常生活最長用的一種算法，也就是把對的加總和總數相除得到結果，公式來説就是：

Accuracy = (TP+TN)/(TP+FP+TN+FN)

以我們的例子就是：(5 + 6) / (5 + 1 + 6 + 2) = 11 / 14 = 0.79。

Accuracy貌似是很好的一個計算方式，但是實際上沒有任何意義。

想象一下，假設今天這個Model要用作於判斷病患有沒有糖尿病，如果説實際上的人有糖尿病的比例是 0.03 （隨便説的數字哦），那麽就算我的Model對於任何病例進來都判斷説沒有糖尿病，那麽最後的Accuracy也會有 0.97

因此，這個數字在Classifier Model來説一點意義也沒有，因此才有了另外兩個數字。

Recall
Recall的的含義是，和狗相關的圖片能夠找出多少張。

公式是：TP / (TP + FN)

以我們的例子就是：5 / (5 + 2) = 5 / 7 = 0.71

Precision
Precision的含義是：所有認爲是狗的，多少真的是狗