iT邦幫忙

第 12 屆 iThome 鐵人賽

0
自我挑戰組

AI 高中生的自我學習系列 第 18

Day 18 - 卷積神經網絡 CNN (3)-Convolution layer

  • 分享至 

  • xImage
  •  

年度ILSVRC競賽 winner Model

https://ithelp.ithome.com.tw/upload/images/20201216/20130601YfXJW7iukq.png

下圖為最知名的卷積神經網絡 1998 LeNet-5,主要是用來辨識手寫數字(MNIST資料庫 - MNIST is a now-famous data set that includes images of handwritten digits paired with their true label of 0, 1, 2, 3, 4, 5, 6, 7, 8, or 9. )。

https://ithelp.ithome.com.tw/upload/images/20201217/20130601s5a848zInI.png

其架構可以歸納為 [convolution layer > pooling layer(subsampling)] 二層 > [fully connective layer]三層 > activation(non-linearity)

卷積神經網絡 CNN 的過程有點複雜,分為以下幾個部分:

  • Convolution layer
  • Pooling layer
    (重複以上步驟多次後再進行Flatten)
  • Flatten/Full Connection
  • Activation Function

Convolution layer

由於特徵會出現在影像中不定位置,並且特徵是規律性的,所以可利用convolution對於local detect會比對整張影像global detect來的較有效率。
在此階段我們會使用filter,使用方式如下圖
https://ithelp.ithome.com.tw/upload/images/20201211/20130601NtwqLwwwhK.png

https://ithelp.ithome.com.tw/upload/images/20201217/20130601odLzOT3Z1y.png

Conolution layer的目的是將圖片中的特徵明顯化,以提高識別成功率。

https://ithelp.ithome.com.tw/upload/images/20201217/20130601UTtJuPUgep.png

註:本文是搜尋數個網站及各種不同來源之結果,著重在學習,有些內容已難辦別出處,我會儘可能列入出處,若有疏忽或出處不可考,請聯絡我, 我會列入, 尚請見諒。

上一篇
Day 17 - 卷積神經網絡 CNN (2)- 戰國時代之版圖擴張
下一篇
Day 19 - 卷積神經網絡 CNN (4)-Pooling layer & Activation Function
系列文
AI 高中生的自我學習30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言