iT邦幫忙

2024 iThome 鐵人賽

DAY 3
0
AI/ ML & Data

我的深度學習-從0開始實作物件偵測系列 第 3

【Day 3】YOLO的版本迭代介紹之 1

  • 分享至 

  • xImage
  •  

一、前言

接著將要介紹YOLO各個版本更新的項目,隨著時間的推進,YOLO也從V1進步到現在V9甚至V10的版本,每個版本都有不同的演算法,因此在正式學習YOLO前,不妨可以先從版本的差異開始了解。

YOLO v1

是最早的版本。由Joseph Redmon等人於2016年提出。網路架構包括24個卷積層和2個全連接層,對於密集目標的辨識度較差。

YOLO v2

相較於v1在做了一些改進,以下列出幾點說明。

  • Batch Normalization (BN): 每層之間加入BN層,降低了gradient傳遞的難度。
  • Dimension Clusters: 使用 K-mean來自動計算應有的another數量和長寬比。
    image

圖片來源:YOLO v2 Paper

YOLO v3

引入了殘差網路模塊(ResNet)。

  • Class Prediction: v3 改用 Sigmoid 取代 Softmax 來做分類的輸出。
  • Darknet-53: 加入了 ResNet 的 residual 設計,提出新的 backbone 結構。

image

YOLO v3 Bounding Box encoding,σ 表示 sigmoid 函數,tx, ty, tw, th 是網路的原始預測值,bx, by, bw, bh 是輸出的 bbox。圖片來源:YOLO v3 Paper

接著明天會繼續介紹v3後的版本,感謝各位今天的觀看。
image


上一篇
【Day2】YOLO系蝦咪挖歌?
下一篇
【Day 4】YOLO的版本迭代介紹之 2
系列文
我的深度學習-從0開始實作物件偵測30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言