今天應該是最後一篇reid的論文了XD
Bag of Tricks and A Strong Baseline for Deep Person Re-identification
標題很直白,就是提出一個很強的reid baseline,
由於近年來reid進步非常迅速,每年benchmark分數不斷創新高。
但許多論文比較都不在一個基準上,因此需要一個公認的baseline方法作為一個標準,
作者首先統計前一年reid方法的分數表現,
可以看到本文提出的baseline可以作為一個目前水平的基準。
也沒有用很複雜的結構或奇怪的衝分tricks,
code也有開源,基本上都可以train到所宣稱的分數(甚至更高)
https://github.com/michuanhaohao/reid-strong-baseline
這是網路架構,
可以看到架構十分簡單,baseline用res50,然後經過一個GAP,
在接上triplet和ID loss
接著介紹本文的重點改進。
Warmup Learning rate:
先用一個低的學習率再回到初始學習率,可以增加訓練穩定性,在很多task都驗證有效。
Random Erasing Augmentation:
隨機擦除部分圖像,也是一種常見的Augmentation
Label Smoothing
平滑one-hot label,避免over-fitting,也是一種常見的trick。
Last Stride
將最後一層conv的stride=1,有更大的feature map,保留更多特徵資訊。
BNNeck
本文亮點,作者發現直接用triplet loss和ID loss對同一個feature space優化方向會互相影響,
因此作者認為讓triplet在較自由的空間中優化,再加上一個normalize BN,
把原本的空間歸一化到超球面,再給ID loss分類會更好
Center Loss
Triplet 只考慮triplet的相對距離,因此加上Center loss讓同ID內聚集更緊密
修改後的架構如下:
和其他方法比較,本文直接將baseline提升到前所未有的高度XD