iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 14
0

大家好,昨天對卷積神經網路(CNN)做了簡單的介紹,認識與其他深度神經網路的不同,因為多了卷積層和池化層,在處理輸入時不需要先變成一維張量,並且對影像資料擷取局部資訊,而非全局資訊,這些特性使CNN在影像辨識上更具優勢。今天就要對卷積層進行介紹。

卷積層(Convolution Layer)的原理是透過卷積核(Kernel)在圖片上進行滑動,對圖片局部資訊進行擷取,並藉由填補(Padding)與步幅(Stride)控制卷積層輸出的特徵圖(Feature map)。接下來就分別介紹卷積核、填補和步幅。

卷積核具有長度、寬度、深度三個維度,長與寬是自己設定,大小常設定為奇數(如3X3或5X5),深度會與當前影像深度相同。卷積層中可以有多個卷積核,需要多少個卷積核是根據下一層要有多少特徵圖決定。

填補是在要處理輸入與輸出不一致的問題時使用,若是輸入是4X4的影像,卷積核大小是3X3,在不使用填補的情況下輸出會變成2X2,會有部分影像損失,在用填補處理的情況,會在原本的影像周圍用零填補,以上面的例子,原本4X4的影像經過填補處理後變成6X6的影像,最後經過計算的輸出影像會是4X4。

步幅是指卷積核每一次滑動的距離,一般設定都是為1,但也可以設定大於成1,通常是用來縮小影像,以減少後面要進行的運算量,假設影像輸入是5X5,卷積核大小是3X3,步幅設定為2,最後輸出大小會是2X2。

今天先介紹了卷積層與部分參數,明天就會進入卷積層的計算。


上一篇
DAY13 - 卷積神經網路介紹
下一篇
DAY15 - 卷積層運算介紹
系列文
AI初見 從零開始的TensorFlow生活30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言