[Day7] 物件偵測關鍵技術 : 非極大值抑制
Non-Maximal Suppression (NMS) 概念:
NMS 是一種後處理方法,用來從多個重疊的預測邊界框中保留最合適的一個,從而避免重複的檢測結果。
主要目標:在物體檢測模型中,對同一物體通常會產生多個重疊的邊界框,這些邊界框有不同的置信度分數(confidence score)。NMS 通過保留具有最高置信度的邊界框,並移除與之重疊較多且置信度較低的其他邊界框,來減少冗餘檢測。
置信度 (Confidence) 和 IoU (Intersection over Union):
置信度:物體檢測模型對某個框中是否包含特定物體的信心程度,數值介於 0 和 1 之間。圖中標示的「Dog: 0.9」和「Dog: 0.4」即是這些邊界框的置信度分數。
IoU (Intersection over Union):IoU 是兩個邊界框的重疊程度。具體來說,它是兩個框的重疊面積(Intersection)除以兩個框的聯合面積(Union)的比例。當兩個框的 IoU 大於某個閾值(例如 0.4)時,表示它們重疊得比較多,NMS 會選擇置信度較高的框,並移除重疊的置信度較低的框。
IoU 計算公式: IoU=Area of OverlapArea of UnionIoU = \frac{\text{Area of Overlap}}{\text{Area of Union}}IoU=Area of UnionArea of Overlap
這個公式被用來計算兩個框的重疊比例,以確定是否應該進行抑制。
NMS 的工作機制:
NMS 的核心思想是:對所有的邊界框進行排序,根據置信度從高到低依次處理:
選擇置信度最高的框,作為保留框。
計算其他框與此保留框的 IoU,若 IoU 大於指定的閾值(如 0.5),則刪除該框。
重複此過程直到沒有剩餘的框。