技術問答
技術文章
iT 徵才
Tag
聊天室
2024 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
3
0
AI & Data
YOLO系列網路技術採用以及實作
系列 第
3
篇
[DAY 3] YOLOv2
15th鐵人賽
Xian
2023-09-18 16:00:22
454 瀏覽
分享至
YOLO9000: Better, Faster, Stronger
Joseph Redmon, Ali Farhadi
可偵測超過9000種類別
問題
過去方法只能辨識很少的類別物件。
替影像作detection標註比做classification標註更耗時。
跟Region proposal based的方法相比,YOLOv1 recall較低。
要提升準確度往往需要提高網路複雜度。
方法:
Better
Batch Normalization
: 取代Dropout,加快收斂且
提升2% mAP
。
High Resolution Classifier
: 先用448×448像素值的影像預先進行訓練10個epochs,先
提升4% mAP
。
Anchor Boxes
:
移除全連結層,並用Anchor Boxes預測Bounding Boxes。
輸入為416×416為了讓特徵圖中的座標為奇數個,這樣中心點座標就會唯一。mAP會下降,但是提升了Recall。
Dimension Clusters
:過去需手動設定Anchor Box數量以及尺寸,但本文利用K-means去生成Bounding Box,可以使得模型學得更好。
K-mean用:
最終求得:
K=5
,Recall跟模型複雜度較為適合。
Direct location prediction
: 每個Grid Cell預測五個Bounding Box,
並且有五個值
bx,by:預測的Bounding Box中心點位置+距離最左邊跟最上面Grid Cell的格數。
bw,bh:預測的Bounding Box寬跟高乘上寬跟高篇移量的exponential結果。
信心度值會再經過sigmoid後輸出
Fine-Grained Features
:串接較為淺層的特徵到深層網路當中,提升1%。
Multi-Scale Training
:為了讓模型可以處理不同大小的影像,每10個batch會重新選擇一個新的影像大小{320,352, ...,608}
Faster
物件偵測網路常採用VGG-16用於特徵提取,但是因為VGG-16參數量太大,YOLOv2提出一個新的分類模型: Darknet-19。
Darknet-19
: 19個convolution layers,5個max pooling layers,參數量少很多。
Stronger
當將兩個Dataset進行合併的時候可能會遇到類別互斥問題,舉論文例子:對於一張狗的影像,有的資料集標得是"狗",有的資料集標的是狗的品種。
建立
Hierarchical Wordtree
:
可藉由路徑上的節點機率來得到對應類別的機率,其中phisical object代表影像中是否有物件存在。
模型訓練
Classification:會先用分類網路預訓練10個epochs訓練448×448的影像,並接續訓練160個epochs。
Detection: 移除上面預訓練好的classification模型最後一層convolution層,並添加三層3×3×1024的卷積層,以及最後加入一層輸出層(1×1×(5 boxes × (5 coordinates +類別數))),中間有加入passthorough層。
實驗結果
文章使用之圖片擷取自該篇論文
留言
追蹤
檢舉
上一篇
[DAY 2] YOLO的開端-YOLOv1
下一篇
[DAY 4] YOLOv3
系列文
YOLO系列網路技術採用以及實作
共
30
篇
目錄
RSS系列文
訂閱系列文
7
人訂閱
26
[DAY 26] YOLOv8模型訓練
27
[DAY 27] 訓練資料前處理(補充)
28
[DAY 28] 訓練資料擴充(補充)
29
[DAY 29] 模型訓練結果
30
[DAY 30] 完賽心得
完整目錄
直播研討會
{{ item.subject }}
{{ item.channelVendor }}
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
1064
組
團體組數
40
組
累計文章數
22208
篇
完賽人數
602
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
windows server
linux
css
react
vue.js
熱門問題
要怎知道LINE使用者的使用地址
outlook無法收發信
防火牆互通問題
小公司 兩台Win Server執行 AD Server ,更新電腦後,需要再多加一組Linux 作業系統來運行資料庫採集
伺服器維護廠商
Cisco 防火牆密碼確認正確,可是無法登入
開啟Microsoft Edge 瀏覽器無法開啟網頁,出現錯誤訊息
bat檔截斷問題
Palo alto防火牆網頁解密問題?
NB突然點選桌面文件,會被刪掉
熱門回答
防火牆互通問題
outlook無法收發信
Palo alto防火牆網頁解密問題?
開啟Microsoft Edge 瀏覽器無法開啟網頁,出現錯誤訊息
if函數中的>&<&=是否可以使用儲存格代替
熱門文章
每日一篇學習筆記 直到我做完專題 :( [Day6]
每日一篇學習筆記 直到我做完專題 :( [Day7]
每日一篇學習筆記 直到我做完專題 :( [Day8]
每日一篇學習筆記 直到我做完專題 :( [Day10]
每日一篇學習筆記 直到我做完專題 :( [Day9]
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}