首先我們先來聊聊為什麼要使用卷積神經網路(CNN),這類型的神經網路主要是用來處理圖片的分類問題,也不是說所有的圖片分類問題都只能使用卷積神經網路,對於單色、小尺寸的圖片而言,利用全連接神經網路便能達成圖片分類的問題.而在處理大尺寸且顏色豐富的圖片時,由於特徵值的量會變得更多及權重參數也會增加(網路結構過於複雜),而我們給的訓練資料不足時,很容易在訓練時發生過擬合(Overfitting)
的問題.
上圖為卷積層運算過程的步驟拆解,其中3x3的矩陣代表著我們將輸入圖片預設為3x3像素,而2x2的矩陣則代表著我們要使用的過濾器(卷積核),進行一系列的卷積層運算,我們可以得到一個新的2x2矩陣代表著一張新圖片稱為特徵圖(Feature map).
彩色圖片的卷積運算示意圖
池化層主要的功能用於對卷積層輸出的特徵圖去進行重點的挑選,池化主要有兩種分別為平均池化(Average Pooling)及最大池化(Max Pooling),但從結果的層面來看功能都是用於縮小特徵值的尺寸.
從上圖中得知我們指定一個2x2的池化尺寸(pooling-size)作為檢視窗口,檢視窗口會將特徵圖分割成數個區域,再取各區域的代表值,產生新的特徵圖.