[D27] 物件偵測(8)

2021 iThome 鐵人賽

DAY 27

Software Development

從林到有＿Image processing系列第 27 篇

13th鐵人賽影像辨識物件偵測 yolov4

林酷妹

團隊NTUST HIS_LAB 有點東西

2021-10-12 20:28:09

4942 瀏覽

分享至

接下來詳細一點的說明 YOLOv4 的內部架構！
目標檢測通常由以下幾個部分組成:

Input：指圖片的輸入
Backbone：在 ImageNet 預訓練的骨架
Neck：通常用來提取不同層級的特徵圖
Head：預測對象類別及 bndBox 的檢測器，通常分兩類 Dense Prediction （one stage）和 Sparse Prediction （two stage）

YOLOv4 模型的架構是由這三部分組成的：

BackBone： CSPDarknet53
Neck： SPP+PAN
HEAD：YOLO HEAD

Dropout

Dropout 是一個有效降低 Overfitting 的方法，與權重衰減的精神相似，皆是在訓練模型時使用的正則化方法，在訓練時每一次的迭代（epoch）皆以一定的機率丟棄隱藏層神經元，而被丟棄的神經元不會傳遞訊息。

在反向傳播時，被丟棄的神經元其梯度是 0，所以在訓練時不會過度依賴某一些神經元，藉此達到對抗 Overfitting 的效果。

要特別注意的是，因為 dropout 只能在訓練時使用，所以會造成測試時向前傳播的訊息大於訓練時向前傳播的訊息，通常會在測試時乘以 1/p 改善這個問題。（這個方式叫 inverted dropout）

為了避免結果大於訓練的情況，需要測試的時候將輸出結果乘以 1/p 使下一層的輸入規模保持不變！
而利用inverted dropout，可以在訓練的時候直接將dropout後留下的權重擴大 1/p 倍，這樣就可以使結果的scale保持不變，而在預測的時候也不用做額外的操作了，更方便一些～

Overfitting：Overfitting 顧名思義就是機器過於糾結誤差值，過度學習訓練資料，變得無法順利去預測或分辨不是在訓練資料內的其他資料。

Weight decay

權重衰減的主要目的是「抑制更新參數的幅度」，在訓練模型時預測的結果會通過 loss 函數評估結果與真實值的差距，再藉由梯度下降更新參數，而權重衰減的方法是在 loss 函數加上一個懲罰項。

用線性回歸中的例子來看：損失函數為 loss（w, b），我們在這個損失函數後加上一個帶有 L2 范數的懲罰項，其中 λ 是懲罰項的倍率，當 λ=0 時，則權重衰減不會發生；當 λ 越大時，懲罰的比率較高，權重衰減的程度也就跟著變大。

weight decay　也是一種對抗模型 overfitting 的正則化方法。
也了解到透過修改懲罰項的係數 λ，改變權重衰減的倍率對於訓練模型會有不一樣的效果。

圖片來源１
 圖片來源２
 圖片來源３

[D26] 物件偵測(7)

[D28] 資料增強

系列文

從林到有＿Image processing 共 30 篇

RSS系列文訂閱系列文

8 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19855 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

從林到有＿Image processing系列 第 27 篇