行人重識別,最重要的目標就是跨攝像頭的追蹤,也就是找到不同攝像頭下的同一個人,
由於在大多數情況下,監控攝影機的畫質都很差,或是方向問題,很多時候沒辦法使用人臉辨識,
這時由行人全身影像來進行辨識的Re-id就很重要了。
由於行人並非簡單的剛性物體,會隨著運動姿勢而改變形狀,
傳統方法使用顏色統計直方圖作為行人特徵,它所描述的是不同色彩在整幅圖像中所佔的比例,其優點是對影像的方向、大小等變化不敏感,並能夠適應小幅度的平移和旋轉。
但傳統特徵的做法還是有其侷限,因此近年來有許多使用Deep Learning的Re-id方法。
這種方法把re-id視為Classification或Verification問題處理:
這是使用圖像檢索image retrieval領域常用的方法,度量學習旨在通過網絡學習出兩張圖片的相似度。
構造樣本對和Loss函數,
常見的經典Loss有:Contrastive loss, Triplet loss..等等,
近年來也有各種變化的Loss,但總歸不出一個核心概念:
使得相同行人圖片(正樣本對)的距離儘可能小,不同行人圖片(負樣本對)的距離儘可能大。
原本大家只關注globel的特徵,但後來也有一派鑽研起行人的局部的特徵,
常見的思路如:圖像切塊,人體骨架關鍵點定位...等等,
試圖挖掘更細節的特徵,著名方法如PCB, MGN等等都是如此思路。
方法簡單,效果也不錯。
接下來幾天會再介紹幾篇Re-id相關的論文。
若對此主題有興趣,歡迎訂閱~