iT邦幫忙

2022 iThome 鐵人賽

DAY 10
0

我們會透過驗證指標來驗證模型的表現能力,根據類型,可分為分類指標與迴歸指標。

  • 分類模型所使用的指標(二元)
    分類問題的結果可以使用混淆矩陣(confusion matrix)呈現,並透過這個矩陣來算出一些指標。

  • 二元混淆矩陣
    先以假定二元分類為「正」、」「負」,下圖為二元分類的混淆矩陣,condition為真實情況(答案), test outcome為模型預測的結果。

    • True Positive (TP): 答案為「正」,模型預測為「正」的個數
    • True Negative(TN):答案為「負」,模型預測為「負」的個數
    • False Positive (FP): 答案為「負」,模型預測為「正」的個數
    • False Negative(FN):答案為「正」,模型說「負」的個數
      https://ithelp.ithome.com.tw/upload/images/20220913/20151279w6XQ7oVRxz.png
      圖片來源: 連結
  • 根據矩陣可計算出的指標如下,

    • Accuracy 準確率: 為模型判斷的正確率,數值越高越好
      https://ithelp.ithome.com.tw/upload/images/20220913/20151279DqHTwSuEtk.png
    • Sensitivity 敏感度: 又稱Recall,為正確判斷正的偵測率,數值越高越好
      https://ithelp.ithome.com.tw/upload/images/20220913/20151279t55FwGDKcz.png
    • Specificity 特意度: 為正確判斷負的偵測率,數值約高越好
      https://ithelp.ithome.com.tw/upload/images/20220913/201512796jJgrgPPKv.png
    • Precision 精確度
      https://ithelp.ithome.com.tw/upload/images/20220913/20151279gLZ8HBcRdq.png
  • 迴歸模型所使用的指標:

    • 均方誤差 (Mean square error, MSE)
      https://ithelp.ithome.com.tw/upload/images/20220913/20151279j1cYnz1lmT.png
    • 平均絕對平方誤差 (Mean absolute error)
      https://ithelp.ithome.com.tw/upload/images/20220913/20151279TH1IskErfs.png
    • 均方根誤差(Root Mean Squared Error, RMSE)
      https://ithelp.ithome.com.tw/upload/images/20220913/201512798TKTkkvVGh.png

實作的部分,在後面幾天的模型實作時會一併操作。


上一篇
[Day9]不平衡資料(Imbalanced data)
下一篇
[Day 11] 驗證(Validation)
系列文
人類行為數據分析- 以R和Python進行實作30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言