今天把昨天講的論文做一個總結,明天就要開始介紹attention了
這是本文使用的資料及
稱為actor 和 action 的資料集
圖中可以看到會有動作及演員
這張圖是資料集中的分類
Actor的部分是y軸的部分,action的部分則是x軸的部分
這個結果最上面的部分為原圖
中間的部分為CNN做出來的結果
最下面則是膠囊網路做出來的結果
從結果可以看出
膠囊網路可以識別的出來在右邊
而非只能式別出白色的狗
IoU是聯集分之交集
前面overlap的p@0.5則是IoU threshol超過0.5以上的範圍
分別對0.5 0.6 0.7 0.8 0.9 的threshold
mAP(mean average precision)則是將overlap p 0.5到0.95的部分加總並且平均
可以看的出來本文提出的方法和之前的方法比起來
準確度更高