技術問答
技術文章
iT 徵才
聊天室
2025 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
14
0
AI & Data
YOLO系列網路技術採用以及實作
系列 第
14
篇
[DAY 14] YOLOv7-上篇
15th鐵人賽
Xian
2023-09-29 06:49:50
1088 瀏覽
分享至
YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
~台灣之光~
目的讓物件偵測網路可以達到即時偵測在行動裝置上。
CPU裝置模型基礎: MobileNet、ShuffleNet、GhostNet。
GPU裝置模型基礎: ResNet、DarkNet、DLA、CSPNet。
本篇會著重在優化訓練過程以及bag-of-freebies。
re-parameterized模組取代原先的模組。
提出擴展(extend)以及複合縮放(co,pound scaling)方法,讓模型可以有效利用參數。
不會像YOLOv6一樣進行self-supervised learning 或是 knowledge distillation方法,因為這樣會需要額外的data。
YOLOv7在related work當中說明了Model re-parameterization技術以及Model Scaling 技術,因此本篇會先完整介紹這兩部分,後篇再把其他YOLOv7採用以及提出的技術一併說明完。
技術採用
Model re-parameterization
在推論的階段將多個運算模組合併成一個。
可視為ensemble技術:
模組ensemble:
將模組拆成多個模組分支,最後推論階段再整合起來。
模型ensemble:
用不同的訓練集獨立訓練個別的模型,並最終將所有模型的weight進行加總取平均。
在不同的iteration都進行weight加總取平均。
本文方法:
re-paprameterized卷積:
YOLOv6網路架構也有採用。
RepConv使用在VGG上可以有很好的結果。
若添加在有Residual或是concatenation連接架構模,準確度會下降很多。
因此設計了有計畫性的(Planned)re-parameterized convolution。
Model scaling
將已經設計好的模型進行縮放,讓他可以應用在不同的硬體裝置上。
縮放因子:
輸入影像的像素大小。
模型的層數(depth)。
通道的數量(channel)。
特徵金字塔(feature paramid)的數量(stage)。
常見的方法為Network architecture Search(NAS):
可以自動搜尋適合的縮放因子。
缺點就是計算耗時。
YOLOv7作者發現,現今的NAS架構處理的縮放因子與參數與操作量無關。
本文方法:
利用concatenation為基礎的模型進行縮放的方式:
縮放concatenation-based的模型都會導致模型輸出channel數改變,對於硬體資源的使用量也會改變。
我們將深度進行縮放,同時也要注意到模型輸出的channel數改變,因此增加了對寬度的縮放機制。
實驗結果:
YOLOv7提出的更有效率的架構、Auxilary head、Lead head、Bag-of-freebies技術以及與其他方法比較的實驗結果將於YOLOv7-下篇進行說明。
文章使用之圖片擷取自該篇論文
留言
追蹤
檢舉
上一篇
[DAY 13] YOLOv6-下篇
下一篇
[DAY 15] YOLOv7-下篇
系列文
YOLO系列網路技術採用以及實作
共
30
篇
目錄
RSS系列文
訂閱系列文
11
人訂閱
26
[DAY 26] YOLOv8模型訓練
27
[DAY 27] 訓練資料前處理(補充)
28
[DAY 28] 訓練資料擴充(補充)
29
[DAY 29] 模型訓練結果
30
[DAY 30] 完賽心得
完整目錄
熱門推薦
{{ item.subject }}
{{ item.channelVendor }}
|
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
902
組
團體組數
37
組
累計文章數
19856
篇
完賽人數
528
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
17th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
linux
windows server
css
react
熱門問題
防火牆fortinet只開放line 問題
Gem如何找到該功能?!我是Gemini付費使用者
中華電信光纜當骨幹...SWminigbic無法正常使用
我在做 packet tracer 的題目,想請問一下該怎麼做
dhcp 在client 端機碼設定的問題
照片破圖或是有損壞,如何修復?
熱門回答
防火牆fortinet只開放line 問題
中華電信光纜當骨幹...SWminigbic無法正常使用
我在做 packet tracer 的題目,想請問一下該怎麼做
dhcp 在client 端機碼設定的問題
熱門文章
Agentic AI 開發實戰:我是如何設計 “Code + LLM” 混合架構,解決 AI品質不穩的問題?
ISC2 CC 證照考試筆記和影片
VScode 開發應用系統專案(10) - Spring boot MVC 應用系統設計(1)
【資料治理實戰回憶錄】04. 拆解元數據 (下):讓資料「用起來」
[gem5] 該怎麼編譯以及運行 gem5 ?
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}