在異常檢測的情況,很常應用非監督式學習,先來了解它是什麼😣。
非監督式學習(Unsupervised Learning),一種機器學習方法,與監督式學習不同,它不需要對訓練數據進行標記,演算法會自動從未標記的數據中尋找關係結構與模式,而且它的目標不是分類或預測具體結果,而是發現數據中的模式、分佈或異常情況。
跟異常檢測較相關的算法:
概念:它是一種神經網絡,學習壓縮輸入數據(編碼)然後重構原始數據(解碼),在異常檢測中,模型會學習數據的「正常」模式並嘗試重構數據,異常點由於與正常數據分佈不同,重構誤差會較高,可以用來識別異常。
應用:適用於數據較為復雜或難以明確定義異常的情況,如圖片、音頻數據,或者是網絡流量中的異常偵測。
優勢:自編碼器能夠在較複雜的異常檢測中學習數據的深層次特徵,因此比孤立森林更適合處理高度非線性和復雜的數據集。
這是一個自編碼器的損失函數,用來衡量輸入數據和重構數據之間的差異,目標是要最小化這個差異,讓自編碼器可以學習有效壓縮和重構數據。
從應用來了解異常檢測的概念:
1.⛑️ DDoS 攻擊防範
DDoS攻擊是一種惡意攻擊,通過大量的虛假流量淹沒系統,導致資源耗盡或無法提供服務,為了有效防範DDoS攻擊,網路流量異常檢測技術能夠及時識別大量異常流量。
內部威脅可能來自擁有合法存取權的內部人員,這些威脅可能是惡意行為(故意洩露數據)或無意的操作失誤。
當然異常檢測還在偵測詐騙(如:識別洗錢行為)、醫療生理參數異常檢測等方面有很大的潛力,但這裡只討論跟企業數據保護有關呦 🫵🏻。