我們這次要學的東西叫做混淆矩陣,混淆矩陣是在機器學習中統計出來的一些資料,在只有兩種結果(1、0)的情況下會有四種結果,分別為TP(預測值和真實值皆為1)、FP(預測值為1真實值為0)、FN(預測值為0真實值為1)、TN(預測值和真實值皆為1),通常如果你給的訓練資料夠多TP跟TN值會越大,這是因為你的電腦經過大量的模型處理準確度已經足夠高了,而我們可以用很多的公式來辨識這個模型判斷的準不準確,像下面的四個公式(PPV、ACC、TPR、TNR)。
精確度precision=PPV
精確度可以確認預測為1的模型的正確率,公式如下圖。
準確度accuracy=ACC
準確度可以確認整個模型的正確率,公式如下圖。
敏感度sensitvity=TPR
敏感度是偵測當真實值為1時的正確率,並與特異度相加為1,公式如下圖。
特異度specificity=TNR
特異度是偵測當真實值為0時的正確率,並與敏感度相加為1,公式如下圖。
有關混淆矩陣的應用會在之後的例子中提到。