CNN 是卷積神經網絡(Convolutional Neural Network)的簡稱,在影像辨識的領域中,一定要認識 CNN!
如上圖所示,CNN 的概念簡單來說其實就是做"兩次"的 Convolution 和 Max pooling,最後再經過兩層 fully Connected layer ,這樣的組合就是 CNN 的架構了~
Convolution 的概念我們上一篇有介紹了,就是將原始圖片透過特定的 filter 做卷積運算
,出來的結果我們稱為 feature map。
圖片出處
再來要講的是 pooling ,在 Pooling Layer 通常採用 Max Pooling
,什麼是 Max pooling 呢? 它的概念很簡單:挑出每組矩陣當中的最大值
!這樣就能提取到影像中每個部分比較重要的特徵,加速收斂並縮小 Feature map 的尺寸!
Max Pooling 主要的好處是當圖片整個平移幾個 Pixels時,對影像判斷上完全不會造成影響,以及有很好的抗雜訊功能。
全連接層的工作就是前面的結果平坦化
(flatten)後做最後的特徵提取,並且利用最後一層的 FC 當作分類器。也就是說經過幾個卷積層和最大池化層之後,最終的分類是通過全連接層完成的。