iT邦幫忙

2021 iThome 鐵人賽

DAY 20
1

物件偵測(Object Detection)是影像辨識中重要的一環~
物件偵測就是在照片或影片等圖像內容中,用""標出物件的範圍,並且分類為何種物件及附帶他是此物件的猜測機率

前面有提過:卷積神經網路(CNN)開始大量的被運用來提升辨識率,可以用來辨識影像。
除了辨識影像,另一個研究方向就是物件的偵測,除了分類,還要框出物件的位置。而且除了框出物件的位置還要能即時的反應物件的移動。
 

種類

物件偵測分為兩大類: two stageone stage

  • Two stage
    先用演算法生成樣本的候選框,再透過卷積神經網絡做影像辨識,是電腦物件偵測中的一般作法。
  • One stage
    很字面上的意思,物件的類別和位置偵測及物件辨識一步到位!這樣的做法速度很快,但精確度就比 two stage 略低了一些。
    但整體辨識率仍在可接受範圍內,因此 One stage 的方法是目前比較多人研發用在行動裝置上的方法。

名詞解釋

現在先來認識一下在物件偵測中會經常看到的名詞吧~

  • Selective Search
    這就是上面 two stage 中提到的演算法,透過人工的方式先把物件可能在的地方挑選出來。

  • Region Proposal
    經由演算法所挑選出的區域,我們稱為 Region Proposal。

  • Bounding box
    我們在文章一開始提到的"框",就是影像辨識中的 bounding box。它含有四個參數(bx, by, bh, bw),分別代表框的 x 座標、y座標、長和寬。

  • Ground truth
    bounding box 需要又實際的基準可以比較,而那個基準就稱為 Ground truth,可視為影像中真正包含目標物件的 bounding box。

  • Object classification & localization
    物件的分類定位是物件偵測中最主要的步驟,剛剛認識的 two stage 就是將這兩個步驟分開來做;而 one stage 則是將兩步驟一起處理。

    *未完待續......

圖片來源1
圖片來源2


上一篇
[D19] DL 深度學習(2)
下一篇
[D21] 物件偵測(2)
系列文
從林到有_Image processing30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言