you only look once - YOLO （2） - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2021 iThome 鐵人賽

DAY 29

0

AI & Data

Python 機器學習實驗室 ʘ ͜ʖ ʘ系列第 29 篇

you only look once - YOLO （2）

13th鐵人賽

2021-10-13 10:21:46

1519 瀏覽

分享至

今天來講一下yolo v1的架構與損失函數，架構如下：

首先先把圖片改變成448 * 448的大小，yolov1總共有24層convolutional layers來擷取圖片特徵，最後兩層
fully connected layers則負責預測物體類別，最後輸出7 * 7 * 30的向量，7來自於切的grid數量，30則是因為輸入的dataset有20個類別加上x,y,w,h,confidence，兩個bounding box(20+5*2)。

loss function看起來非常可怕，我們來拆解一下：

總共有五項，中心概念是輪過所有grid的每一個bounding box去計算MSE，第一項針對(x,y)中心座標，第二項針對w,h 寬與長，第三項針對confidence，第四項只有在bounding box不包含物體中心時才計算，最後一項則是分類誤差。

[reference]
https://medium.com/@ankushsharma2805/yolo-v1-v2-v3-architecture-1ccac0f6206e
https://zhuanlan.zhihu.com/p/37850811
https://zhuanlan.zhihu.com/p/58066901
https://zhuanlan.zhihu.com/p/94986199
https://www.youtube.com/playlist?list=PLANbacZNzD9FOcLenvcfgE7R4QdHgOXSq

you only look once - YOLO （1）

系列文

Python 機器學習實驗室 ʘ ͜ʖ ʘ 共 30 篇

目錄

RSS系列文訂閱系列文

6 人訂閱

完整目錄

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22211 篇

完賽人數

600 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js