iT邦幫忙

2021 iThome 鐵人賽

DAY 22
1
Software Development

從林到有_Image processing系列 第 22

[D22] 物件偵測(3)

上一篇我們認識了基本的 R-CNN 和 Fast-RCNN,接著來看 Faster RCNN!

  • Faster RCNN
    Fast R-CNN的改進,包括了減少在 R-CNN 重複提取特徵的缺點,將 ROI 映射到 feature maps 上,並用 ROI pooling 統一維度等等。
    但是為了迎來更快的偵測速度,在 Proposals 上的處理也需要更有效率。
    Faster RCNN 就是依據前兩個模型為基礎做改進,主要是以"RPN"和"Anchor box"的配合取代了 Selective Search!

    • RPN:接收一個 feature map 作為輸入 ,輸出一系列目標物體出現可能性較高的候選框。

    • Anchor box:使用 RPN 的目標是對候選框的回歸,而網絡不可能自動生成任意大小的候選框,這時就需要 Anchor ,Anchor 會根據feature map 在原圖片上劃分出很多大小、寬高比不相同的 Anchor box。

    feature map 上一個像素可以映射到原圖上 16 x 16 的區域大小,然後按照 1:2 ,1:1 ,2:1 三種比例生成 Anchor box。

機器只取機率前 300 高的 anchor box 進入後面的程序,這樣足以獲得很好的結果,也同時節省運算時間。那要怎麼辨別 anchor box 的去留呢?

  1. 與 ground truth 有最大的 IoU。
  2. 與任一個 ground truth 的 IoU 大於 0.7。

IoU:Intersection over union,框框的交集面積除以框框的聯集面積,值會介於 0~1 之間(0 表示預測位置與標準答案之間一點邊都沒碰到;1 表示預測位置完全吻合標準答案)
圖片來源1
圖片來源2
論文


上一篇
[D21] 物件偵測(2)
下一篇
[D23] 物件偵測(4)
系列文
從林到有_Image processing30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言