iT邦幫忙

2023 iThome 鐵人賽

DAY 22
0
自我挑戰組

AI研究系列 第 22

YOLO 影像辨識(二): You Only Look Once(YOLO)的特色

  • 分享至 

  • xImage
  •  

YOLO的優勢與限制,例如:

速度快:YOLO只需要一次前向傳播就可以完成物件偵測,而不需要重複掃描圖片或產生候選區域。這使得YOLO可以達到實時的速度,適合用於視頻或即時應用。
泛化能力強:YOLO將物件偵測視為一個回歸問題,而不是一個分類問題。這使得YOLO可以更好地處理不同大小、形狀和姿態的物件,以及背景雜亂的場景。YOLO也可以輕易地遷移到其他領域,例如人臉偵測或車牌辨識。

預測全局性:YOLO在做預測時會考慮整張圖片的資訊,而不是只關注局部的特徵。這使得YOLO可以減少錯誤的預測,例如將背景中的物件誤認為前景中的物件。
YOLO也有一些限制,例如:

背景錯誤少:YOLO對背景的預測錯誤率比其他影像辨識演算法低,因為它對每個格子只預測B個邊界框,而不是對每個候選區域都預測一個邊界框。這樣減少了對背景的關注,也減少了對背景的錯誤預測。

定位不準:由於YOLO將圖片切分成固定數量的格子,並且每個格子只能預測有限數量的邊界框,因此YOLO可能無法準確地定位邊界框的位置,尤其是對於小物件或密集物件的情況。
無法處理遮擋:由於YOLO只關注邊界框內包含物件的信心值,而不關注邊界框之間的關係,因此YOLO可能無法處理物件之間相互遮擋的情況,例如將一群人當作一個物件來處理。
缺乏細節:由於YOLO使用了下採樣(downsampling)和批次正規化(batch normalization)等技術來加速計算和提高準確性,因此YOLO可能會丟失一些細節資訊,例如物件的紋理或形狀。


上一篇
YOLO 影像辨識(一): You Only Look Once (YOLO),快速而準確的影像辨識演算法。
下一篇
YOLO 影像辨識(三): YOLO在影像辨識中的步驟。
系列文
AI研究30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言