技術問答
技術文章
iT 徵才
聊天室
2026 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
7
0
AI & Data
YOLO系列網路技術採用以及實作
系列 第
7
篇
[DAY 7] YOLOv5-上篇
15th鐵人賽
Xian
2023-09-22 06:39:39
2569 瀏覽
分享至
YOLOv5: the fifth iteration of the revolutionary "You Only Look Once" object detection model
Glenn Jocher : YOLOv5作者及Ultralytics公司的創始人。
上篇-主要介紹YOLOv5的命名爭議以及整體網路架構,
沒有發表論文。
Github YOLOv5 issue
中作者回覆截至今日仍沒有釋出官方的YOLOv5論文。
YOLOv5的網路架構仍然由
BackBone
、
Neck
以及
Head
組成。
YOLOv5的爭議問題
命名問題:
沒有發表論文,且不是原作者,且實現的方式不夠創新。
YOLOv4的論文當中作者對於YOLOv5所使用的Mosiac Augmentation以及基因演算法挑選超參數的概念表示感謝。
但YOLOv5作者認為不管網路稱作YOLOv5、FastYOLO、或是YOLOv4-accelerated,只要最終有名稱改動,都會更新並且公告給大家。
網路架構說明
本架構圖為自行繪製,若有錯誤歡迎指正。
Backbone:
Focus架構(最終沒採用)
間隔像素取值,一張影像輸入會輸出四張圖片,輸出通道數變成四倍,用途主要為減少影像的重要訊息丟失。
這項技術在YOLOv5初期的模型有被提出,但最後已被6x6 Convolution架構取代,功能相同但可以簡化模型。
CSP架構
設計兩種CSP架構,其中一支(CSP_1)用於Backbone,另一支(CSP_2)用在Neck。
CSP_1: 主要增加殘差網路,避免梯度消失的問題。
Neck:
CSP
CSP_2: 加強網路特徵融合的能力。
SPPF
FPN以及PAN架構
如同YOLOv4架構一樣。
Head:
採用YOLOv3的Head。
Bounding Box Regression:
C-IOU: ,YOLOv5採用C-IOU,C-IOU在YOLOv4上篇,有詳細的說明。
Non-Maximum Suppression:
YOLOv5採用NMS: 一樣是去除影像上方重複的Bounding Box,但是在網路上有很多人將YOLOv5的NMS改成YOLOv4的DIOU-NMS可以改善重疊物件的遮當問題。
文章使用之"作者論文出版回覆圖"取自YOLOv5官網,"Focus技術介紹圖"取自其他YOLOv5介紹網站。
YOLOv5-下篇將說明該網路的其他技術、損失函數採用,以及Bounding Box座標的計算方式,以及相關實驗比較結果。
參考文獻
YOLOv5官方網站
YOLOv5爭議問題回覆
YOLOv5官方模型架構說明
Focus架構的差異
YOLOv5 Code解析
YOLOv5可視化網路架構圖
YOLOv5中的Focus模組的理解
留言
追蹤
檢舉
上一篇
[DAY 6] YOLOv4-下篇
下一篇
[DAY 8] YOLOv5-下篇
系列文
YOLO系列網路技術採用以及實作
共
30
篇
目錄
RSS系列文
訂閱系列文
11
人訂閱
26
[DAY 26] YOLOv8模型訓練
27
[DAY 27] 訓練資料前處理(補充)
28
[DAY 28] 訓練資料擴充(補充)
29
[DAY 29] 模型訓練結果
30
[DAY 30] 完賽心得
完整目錄
熱門推薦
{{ item.subject }}
{{ item.channelVendor }}
|
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
902
組
團體組數
37
組
累計文章數
19830
篇
完賽人數
528
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
17th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
linux
windows server
css
react
熱門問題
請推薦 虛擬主機 VPS,及Apache SSL 設定
VMware vSphere 的 ESXi 主機憑證(Host CA/SSL Certificate)更新
Workflow ERP 料/工/費 問題:多階產品成本結構分析表
到這個階段要怎麼更上一層樓?
openclaw+ollama啟動失敗
有關用GOOGLE表單掃QR CODE 簽到退,後續統計時數如何設定
熱門回答
openclaw+ollama啟動失敗
Workflow ERP 料/工/費 問題:多階產品成本結構分析表
到這個階段要怎麼更上一層樓?
請推薦 虛擬主機 VPS,及Apache SSL 設定
有關用GOOGLE表單掃QR CODE 簽到退,後續統計時數如何設定
熱門文章
[SRE×AI #08] Claude Skills 實戰:把你的 SRE 經驗變成一句指令
中華電信近期發生問題,MSA可以收信不能發信
這幾天好像用 Teams 傳圖,圖會看不見?
[TOK-01] 什麼是 Task Ontology Kernel (TOK)?
為什麼你的 AI Agent 總是丟失記憶?我們是怎麼解決的
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}