技術問答
技術文章
iT 徵才
Tag
聊天室
2025 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
3
0
AI & Data
YOLO系列網路技術採用以及實作
系列 第
3
篇
[DAY 3] YOLOv2
15th鐵人賽
Xian
2023-09-18 16:00:22
668 瀏覽
分享至
YOLO9000: Better, Faster, Stronger
Joseph Redmon, Ali Farhadi
可偵測超過9000種類別
問題
過去方法只能辨識很少的類別物件。
替影像作detection標註比做classification標註更耗時。
跟Region proposal based的方法相比,YOLOv1 recall較低。
要提升準確度往往需要提高網路複雜度。
方法:
Better
Batch Normalization
: 取代Dropout,加快收斂且
提升2% mAP
。
High Resolution Classifier
: 先用448×448像素值的影像預先進行訓練10個epochs,先
提升4% mAP
。
Anchor Boxes
:
移除全連結層,並用Anchor Boxes預測Bounding Boxes。
輸入為416×416為了讓特徵圖中的座標為奇數個,這樣中心點座標就會唯一。mAP會下降,但是提升了Recall。
Dimension Clusters
:過去需手動設定Anchor Box數量以及尺寸,但本文利用K-means去生成Bounding Box,可以使得模型學得更好。
K-mean用:
最終求得:
K=5
,Recall跟模型複雜度較為適合。
Direct location prediction
: 每個Grid Cell預測五個Bounding Box,
並且有五個值
bx,by:預測的Bounding Box中心點位置+距離最左邊跟最上面Grid Cell的格數。
bw,bh:預測的Bounding Box寬跟高乘上寬跟高篇移量的exponential結果。
信心度值會再經過sigmoid後輸出
Fine-Grained Features
:串接較為淺層的特徵到深層網路當中,提升1%。
Multi-Scale Training
:為了讓模型可以處理不同大小的影像,每10個batch會重新選擇一個新的影像大小{320,352, ...,608}
Faster
物件偵測網路常採用VGG-16用於特徵提取,但是因為VGG-16參數量太大,YOLOv2提出一個新的分類模型: Darknet-19。
Darknet-19
: 19個convolution layers,5個max pooling layers,參數量少很多。
Stronger
當將兩個Dataset進行合併的時候可能會遇到類別互斥問題,舉論文例子:對於一張狗的影像,有的資料集標得是"狗",有的資料集標的是狗的品種。
建立
Hierarchical Wordtree
:
可藉由路徑上的節點機率來得到對應類別的機率,其中phisical object代表影像中是否有物件存在。
模型訓練
Classification:會先用分類網路預訓練10個epochs訓練448×448的影像,並接續訓練160個epochs。
Detection: 移除上面預訓練好的classification模型最後一層convolution層,並添加三層3×3×1024的卷積層,以及最後加入一層輸出層(1×1×(5 boxes × (5 coordinates +類別數))),中間有加入passthorough層。
實驗結果
文章使用之圖片擷取自該篇論文
留言
追蹤
檢舉
上一篇
[DAY 2] YOLO的開端-YOLOv1
下一篇
[DAY 4] YOLOv3
系列文
YOLO系列網路技術採用以及實作
共
30
篇
目錄
RSS系列文
訂閱系列文
10
人訂閱
26
[DAY 26] YOLOv8模型訓練
27
[DAY 27] 訓練資料前處理(補充)
28
[DAY 28] 訓練資料擴充(補充)
29
[DAY 29] 模型訓練結果
30
[DAY 30] 完賽心得
完整目錄
熱門推薦
{{ item.subject }}
{{ item.channelVendor }}
|
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
902
組
團體組數
37
組
累計文章數
13224
篇
完賽人數
114
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
17th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
windows server
linux
css
react
熱門問題
因為網路磁碟的關係造成系統自動重新開機
Java證照題目(main() method)
iatf16949資訊稽核
微軟更新重開機很久
iatf16949資訊稽核內容
部屬電腦如何讓每一台開始功能表跟工作列都一樣
請問有推蘪的server , vmware 防毒軟體嗎
瀏覽某網站,時間太長
useCrudSchemas的swtich欄位吃不到網址的參數
請教大神.這個google試算表到底發生了什麼事情?輸入或是修改資料整張工作表會被清空,已自行解決完成.感謝.
熱門回答
iatf16949資訊稽核
因為網路磁碟的關係造成系統自動重新開機
微軟更新重開機很久
請問有推蘪的server , vmware 防毒軟體嗎
iatf16949資訊稽核內容
熱門文章
第8天,作業系統信任的根憑證 / 魯十二滷肉飯(新北新莊) | 30天滷肉飯
第9天,政府機關公開金鑰基礎建設 GPKI / 大碗公當歸羊肉(新北板橋)| 30天滷肉飯
[為你自己學 n8n] 第 9 天,Google 大神駕到:串接服務的必修儀式!
第9天,Cloudflare SSL 憑證 / 板橋小籠包 | 30天板橋湳雅夜市
第10天,X.509 與 ASN.1 / 夯・魯肉飯(台北信義) | 30天滷肉飯
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}