DAY 24 YOLOv4 MNIST手寫數字辨識資料 -3

2023 iThome 鐵人賽

DAY 24

AI & Data

Diffusion 模型、物件偵測Yolo v7& Yolo v4 系列第 24 篇

15th鐵人賽

smitlea

團隊NUTC_IMAC_EFL

2023-10-05 19:06:15

1050 瀏覽

分享至

tags: `第 16 屆 iThome 鐵人賽 (2023)`

{%hackmd BJrTq20hE %}

以測試資料評估模型準確率與預測

已經完成訓練模型, 現在要使用 test 測試資料來評估模型準確率.

- # 1.評估模型準確率 # 使用下面代碼評估模型準確率: 
scores = model.evaluate(x_Test_norm, y_TestOneHot)  
print()  
print("\t[Info] Accuracy of testing data = {:2.1f}%".format(scores[1]*100.0))

＞＞＞[Info] Accuracy of testing data = 97.６%

# 進行預測 
print("\t[Info] Making prediction to x_Test_norm")  
prediction = model.predict(x_Test_norm)
prediction = np.argmax(prediction,axis=1)
print()  
print("\t[Info] Show 10 prediction result (From 240):")  
print("%s\n" % (prediction[240:250]))
plot_images_labels_predict(X_test_image, y_test_label, prediction, idx=240)

＞＞＞[Info] Making prediction to x_Test_norm
＞＞＞313/313 [==============================] - 0s 1ms/step
＞＞＞[Info] Show 10 prediction result (From 240):
　　　[5 9 8 7 2 3 0 6 4 2]
prediction = model.predict_classes(x_Test_norm)
predict_classes()函數在 TensorFlow 2.6 版本中被移除了以:

prediction = (model.predict(x_Test_norm) > 0.5).astype(“int32”)

prediction = model.predict(x_Test_norm)
prediction = np.argmax(prediction,axis=1)

最後選擇第二選擇,因為前者為二進制

顯示混淆矩陣 (Confusion matrix)

如果想要進一步知道建立的模型中,那些數字預測準確率最高,那些數字最容易混淆,此時可以使用混淆矩陣(Confusion matrix).
在機器學習領域,特別是統計分類的問題,混淆矩陣(也稱為 error matrix)是一種特定的表格顯示方式,可以以視覺化的方式,了解Supervisored Learning的結果,看出訓練出來的模型在各個類別的表現狀況.

# 1.使用 pandas crosstab 建立混淆矩陣 (Confusion matrix) 
print("\t[Info] Display Confusion Matrix:")  
import pandas as pd  
print("%s\n" % pd.crosstab(y_test_label, prediction, rownames=['label'], colnames=['predict']))

對角線是預測結果正確的數字, 我們發現類別 “1” 的預測準確率最高共有 1,125 筆; 類別 “5” 的準確率最低共有 852 筆.
其他非對角線的數字, 代表將某一類別預測成其他類別的錯誤. 例如將類別 “5” 預測成 “3” 共發生 12 次.

# 2.建立真實與預測的 dataframe 
# 如找出那些 label 結果為 "5" 的結果被預測成 "3" 的資料, 所以建立的下面的 dataframe: 
df = pd.DataFrame({'label':y_test_label, 'predict':prediction})
df[:2] # 顯示前兩筆資料

# 3.查詢 label=5; prediction=3 的資料 
# Pandas Dataframe 可以讓你很方便的查詢資料: 
out = df[(df.label==5) & (df.predict==3)] # 查詢 label=5; predict=3 的 records
out.__class__ # 輸出是另一個 DataFrame
print(out)

# 4.查看第 340 筆資料 
plot_images_labels_predict(X_test_image, y_test_label, prediction, idx=340, num=1)

到目前為止模型準確率為97.８%

隱藏層增加為 1000 個神經元

為了增加準確率, 我們將 Hidden layers 的數目從 256 提升到 1000 個神經元:

#1. 修改模型 
from keras.models import Sequential  
from keras.layers import Dense  
  
model = Sequential()  # Build Linear Model  
model.add(Dense(units=1000, input_dim=784, kernel_initializer='normal', activation='relu')) # Modify hidden layer from 256 -> 1000  
model.add(Dense(units=10, kernel_initializer='normal', activation='softmax'))   
print("\t[Info] Model summary:")  
model.summary()  
print("")  
show_train_history(train_history,'accuracy','val_accuracy')

檢視執行結果
從下面的 “accuracy” vs “validation accuracy” 的圖可以看出兩者差距拉大 (training accuracy > validation accuracy), 說明 Overfitting 問題變嚴重

多層感知器加入 DropOut 功能以避免 Overfitting

為了解決 Overfitting 問題, 接下來會加入 Dropout 功能, 以避免 Overfitting
Dropout 是指在模型訓練時隨機讓網絡某些隱含層節點的權重不工作，不工作的那些節點可以暫時認為不是網絡結構的一部分，但是它的權重得保留下來（只是暫時不更新而已），因為下次樣本輸入時它可能又得工作了。

#1. 修改隱藏層加入 DropOut 功能

from keras.models import Sequential  
from keras.layers import Dense  
from keras.layers import Dropout  # ***** Import DropOut mooule *****  
  
model = Sequential()     
model.add(Dense(units=1000, input_dim=784, kernel_initializer='normal', activation='relu'))   
model.add(Dropout(0.5))  # ***** Add DropOut functionality *****  
model.add(Dense(units=10, kernel_initializer='normal', activation='softmax'))   
print("\t[Info] Model summary:")  
model.summary()  
print("")  
show_train_history(train_history,'accuracy','val_accuracy')

檢視進行訓練後結果
最後一個 Epoch 的執行結果可以發現 acc 與 val_acc 接近許多, 說明 Overfitting 問題有被解決.

建立多層感知器模型 (包含兩個 Hidden Layers)

為了進一步提升準確率, 可提升多元感知器 Hidden layer 的層數.

#1. 變更模型使用兩個 Hidden Layers 並加入 DropOut 功能 
from keras.models import Sequential  
from keras.layers import Dense  
from keras.layers import Dropout  # Import DropOut mooule  
model = Sequential()  # Build Linear Model  
model.add(Dense(units=1000, input_dim=784, kernel_initializer='normal', activation='relu')) # Add Input/ first hidden layer  
model.add(Dropout(0.5))  # Add DropOut functionality  
model.add(Dense(units=1000, kernel_initializer='normal', activation='relu')) # Add second hidden layer  
model.add(Dropout(0.5))  # Add DropOut functionality  
model.add(Dense(units=10, kernel_initializer='normal', activation='softmax')) # Add Hidden/output layer  
print("\t[Info] Model summary:")  
model.summary()  
print("")  
show_train_history(train_history,'accuracy','val_accuracy')