iT邦幫忙

2023 iThome 鐵人賽

DAY 20
0
tags: 第 16 屆 iThome 鐵人賽 (2023)

{%hackmd BJrTq20hE %}

YOLO v4 ? 這是什麼?

2020 年在 AI 領域中有不少令人振奮的技術創新,在電腦視覺領域的 YOLO v4 以及自然語言領域的 GPT-3,而 YOLO (You Only Look Once) 為物件偵測 (Object Detection) 的重要技術。

在 2020 年 4 月時就推出了 YOLOv4,總共有三位作者,第一個是來自俄羅斯的 Alexey Bochkovskiy,他曾經參與 YOLO github 的項目維護,而另外兩位則來自台灣,分別是中央研究院資訊所的廖弘源所長與王建堯博士,YOLOv4 在 AI Rewind 2020: A Year of Amazing Papers 榮獲 2020 年度最驚艷的論文之一,簡直是 AI 界的台灣之光。

物件偵測的應用

物件偵測在現實生活中可以解決許多問題,例如

  • 瑕疵偵測:製造業常用的瑕疵檢測
  • 醫療產業:目前疫情下的口罩偵測和病房的擁擠程度等等
  • 人臉偵測:進一步可以發展為人臉辨識,進而實現人臉打卡、罪犯追蹤
  • 交通路況偵測:促進智慧交通的發展,像是車流或是人流偵測

為甚麼我們採用YOLO v4?

有YOLO v4 那麼肯定有前面的 v1、2、3麻,那為什麼我要教YOLOv4呢?YOLO (You Only Look Once)是目前輕量化目標檢測網路效果最好的結構之一,經過不同的更新與改進,現在已經到了第八個版本 (v8)。如果你提及了自己正在使用 YOLO 進行一些工作,那麼別人大概會問你 YOLO 的原理是什麼?這個版本與上一版本的差異是什麼?,而為什麼選擇v4是因為YOLOv4排除不被官方承認的v5外,與v7被認為是一種較為經典的預訓練機器學習模型,從此下手會更容易了解背後的原理。

與YOLO v3的差異


【YOLOv3網路架構圖】


【YOLOv4網路架構圖】

  • Backbone Darknet53 CSPDarknet53 參數量減少,進而減少運算量,甚至能提高準確率
  • Neck FPN PANet + SPP 提升局部特徵和全局特徵的融合,進而豐富最終特徵圖的表達能力

YOLO v3 與 YOLO v4的相同點

  • Prediction head 的設計與 v3 相同。
  • Backbone 使用的是 CSPDarknet53,是 Darknet53 加入 CSP(Cross-Stage Paitial) 的變形系列。

YOLO v4與v3的效果對比

如果有興趣的可以先到
https://github.com/bubbliiiing/yolov4-pytorch
把模型下載下來預習,我們會在明天做更詳細的介紹

參考網站

https://aiacademy.tw/yolo-v4-intro/

https://u9534056.medium.com/%E7%9B%AE%E6%A8%99%E6%AA%A2%E6%B8%AC-yolo-v1-v5-%E5%85%A8%E7%89%88%E6%9C%AC%E5%B7%AE%E7%95%B0-c648cc5e49f1


上一篇
DAY 19 ControlNet Segmentation 影像分割
下一篇
DAY 21 YOLOv4 訓練教學
系列文
Diffusion 模型、物件偵測Yolo v7& Yolo v4 30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言