iT邦幫忙

2021 iThome 鐵人賽

DAY 4
2
自我挑戰組

學姊,要不要來我家看電腦後空翻阿系列 第 4

Day4 - Yolo? 那是什麼? 能玩嗎?

  • 分享至 

  • xImage
  •  

今天要介紹的是(小鼓滾奏)……………..YOLO!
YOLO(you only live once)原為網路用語,意旨活在當下,享受人生。
但今天的YOLO(you only look once)是一個物件偵測的類神經網路演算法,以darknet架構實作,作者為 Joseph Redmon。其中又以輕量.高效率為特點。

接下來介紹YOLO各版本的進展、優缺點以及更新內容—

  1. YOLO v1:
    Yolo直接用整張圖片當作神經網路的輸入,比起R-CNN耗時費力的逐一pixel形成大量window;yolo則是剛開始就把圖片切割成SxS等分,並且只需要讓物體中心在框(Bounding Box)內即可,這樣就不需要讓整個物體都在框中。到最後輸出會有長(L)、寬(H)、中心(x,y)、信心程度(confidence)。
    https://ithelp.ithome.com.tw/upload/images/20210904/20140460q0y1NBRB0N.png
    ▲最後輸出會長這樣
    至於第一代的優缺,優點是速度快,可以達到實時(Real Time)的效果,但是位置的精準度還有待加強,而且小型的東西預測準度會較差。
    https://ithelp.ithome.com.tw/upload/images/20210904/201404600O5Lthqpgu.png

  2. YOLO v2:

  • 最大的變化是改進V1精度不足的缺點,使用了anchor box。
  • 以卷積層(conv layer)取代掉原本的全連接層(fc layer)。
  • 提高解析度 : 因為V1訓練時第一步是先用224224訓練,第二步再丟給448448訓練。這樣會導致V1的conv layer需要適應新的resolution。V2則更改成在第一步時就先讓他看一點點的448*448,這樣在第二步訓練時就不會水土不服。
  • 加上了batch normalization。細節有點多,但具體的功用是讓神經網路知道自己應該什麼時候做normalization(正規化,模型收斂)或是什麼都不做。也因為這樣,所以移掉了負責防止過擬合(訓練時100分考試不及格的小廢廢)的Dropout layer。
  1. YOLO v3:
  • 使用Darknet-53,並且再加53層的訓練檢測。比起V2增加了更多層數,因此犧牲了速度,並提升了精度。
  • 使用Bounding Box Prediction,用來預測某bounding box是target的機率有多大。
  • 使用Binary Cross Entropy取代softmax對bounding box分類。原本softmax預設每個bounding box只有一個類別,但現實中常常會有重複、同一Bounding Box有兩種類別的情況。
    像是可愛的阿福https://ithelp.ithome.com.tw/upload/images/20210904/20140460zPFpCUF4cj.png身上有大ㄐ— 咳恩……. 我是說….. 大寶劍(・∀・)
  • V3還比V2多了很多預測Bounding Box的scale,V2原本只有 1313,V3變成有1313 . 2626 . 5252等多種scale,使得V3比V2有更好的判斷細小特徵的能力。
  1. YOLO v4:
    比起V3,在保證速度的情況下,使精度大幅度上升,上圖
    https://ithelp.ithome.com.tw/upload/images/20210904/20140460UFtscobxiN.png
    V4 : 老三阿我和你的差距大概只有那麼一點點
    https://ithelp.ithome.com.tw/upload/images/20210904/201404601MgqyiP5uM.png

參考資料:
https://mropengate.blogspot.com/2018/06/yolo-yolov3.html
https://blog.csdn.net/Prepared/article/details/107294961
https://zhuanlan.zhihu.com/p/94986199
https://medium.com/image-processing-and-ml-note/yolo-v1-%E7%89%A9%E4%BB%B6%E5%81%B5%E6%B8%AC-%E8%AB%96%E6%96%87%E6%95%B4%E7%90%86-935bfd51d5e0
https://medium.com/image-processing-and-ml-note/yolo-v2-%E7%89%A9%E4%BB%B6%E5%81%B5%E6%B8%AC-%E8%AB%96%E6%96%87%E6%95%B4%E7%90%86-a8e11d8b4409
https://iter01.com/544669.html
https://www.gushiciku.cn/pl/pnsp/zh-tw
https://medium.com/image-processing-and-ml-note/yolo-v3-%E7%89%A9%E4%BB%B6%E5%81%B5%E6%B8%AC-%E8%AB%96%E6%96%87%E6%95%B4%E7%90%86-11ee909430c8
https://medium.com/ching-i/yolo%E6%BC%94%E9%80%B2-3-yolov4%E8%A9%B3%E7%B4%B0%E4%BB%8B%E7%B4%B9-5ab2490754ef


上一篇
Day3 - Yolo? 那是什麼? 能喝嗎?
系列文
學姊,要不要來我家看電腦後空翻阿4
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言