今天要介紹CNN網路中的第三個要素-池化層
池化層的工作是將卷積層產出的特徵圖做類似壓縮及萃取的動作
在數層卷積層中間插入池化也可以防止過擬合
只萃取特徵圖中重要的資訊再傳給下一位,降低後面的運算量
池化運算跟卷積運算很類似,一樣是在圖片上一步步移動,計算每個區塊的權重
上圖可以看到每處都被分成了2x2的小區塊,表示使用2x2的核,一次移動2步
最大池化指的是取出每個區塊中的最大值,例如左上角[510,255,0,255]取最大值510作為代表
右邊輸出的圖像變成只有原圖的1/4,像是被壓縮了一樣
那為什麼要取最大值,不是取最小值或平均值呢?
我的理解是卷積層輸出的特徵代表的是神經元對圖片的反應
反應越大就輸出越高電位,如果神經元的喜好是越來越接近我們的期待
那電位最高的地方(最大值)理應就是我們要的地方