CNN在deep learning裡佔了非常大比例的應用,主要用在圖像識別上,架構如下:
CNN的hidden layer包含了m個feature layer,每個feature layer主要利用一個nxn的矩陣來掃視input,可以把這個nxn的矩陣當作放大鏡來觀測圖片裡的特徵,矩陣本身包含著w和b(也就是deep learning裡我們要優化的參數)。
每個hidden layer之後會加上一個pooling layer去減少模型參數的數量,pooling layer本身也是一個矩陣,但矩陣本身沒有包含任何值,主要功能是在掃視圖片時,把當下每個矩陣內的最大值選出來(也有其他的方法比如取平均),因而降低參數數量(downsampling)。
最後則會有一個fully connected hidden layer,來把前面提取到的特徵轉化成分類機率。