iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 5
0

今天要介紹CNN網路中的第三個要素-池化層

池化層(Pooling Layer)

池化層的工作是將卷積層產出的特徵圖做類似壓縮及萃取的動作
在數層卷積層中間插入池化也可以防止過擬合
只萃取特徵圖中重要的資訊再傳給下一位,降低後面的運算量

最大化池化(Max pooling)


池化運算跟卷積運算很類似,一樣是在圖片上一步步移動,計算每個區塊的權重
上圖可以看到每處都被分成了2x2的小區塊,表示使用2x2的核,一次移動2步
最大池化指的是取出每個區塊中的最大值,例如左上角[510,255,0,255]取最大值510作為代表
右邊輸出的圖像變成只有原圖的1/4,像是被壓縮了一樣

那為什麼要取最大值,不是取最小值或平均值呢?
我的理解是卷積層輸出的特徵代表的是神經元對圖片的反應
反應越大就輸出越高電位,如果神經元的喜好是越來越接近我們的期待
那電位最高的地方(最大值)理應就是我們要的地方


上一篇
教電腦瞎子摸象摸出個所以然part.2 (星期九要不要來一杯痛苦的滋味?)
下一篇
教電腦瞎子摸象摸出個所以然part.4
系列文
為了解決財務危機從Unity跳槽來寫AI辨識的心路歷程6
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言