iT邦幫忙

2023 iThome 鐵人賽

DAY 12
0
AI & Data

AI語音模型訓練: machine learning 和 deep learning 的學習與應用系列 第 12

Day12 捲積神經網路(Convolution Neural Network) 下篇

  • 分享至 

  • xImage
  •  

今天這篇將會繼續介紹捲積神經網路的剩下兩層

池化層(Pooling Layer):

池化層通常在卷積層之後,它的主要作用是減少特徵映射的空間尺寸,同時保留重要的特徵信息,降低計算成本。
在區域選擇上,池化層在上一層產生的特徵圖上,以矩形或正方形區塊為一個區塊,但和捲積層不同的是池化層在區域掃描時是不重複的。
在進行池化化操作時,常見的做法有最大池化(Max Pooling)或平均池化(Average Pooling),最大池化是在區域內選最大的特徵值作為代表,而平均池化則取區域內特徵值的平均。
池化層縮減特徵圖的作用不僅能夠提升模型的運作效率,減少過擬和的風險,還可以增加模型的平移不變性(Translation Invariance,即使輸入圖像中的特徵稍微移動,池化層仍然能夠識別到相同的特徵。能夠提高模型對物體位置變化的容忍度)。
https://ithelp.ithome.com.tw/upload/images/20230927/201606309bVsZUkh0G.png
圖片來源: 連結

在進入下一層之前,神經網路還會進行一項操作,也就是特徵圖的展開(Flatten)
接續捲積層和池化層的特徵提取後,得到的特徵圖需要展開程一維向量,使得特徵圖能在全連接層發揮作用。
展開的操作方法是將特徵圖中的所有元素從左到右、從上到下的順序排列成一個一維向量。最後所有的像素值都被串聯在一起,形成一個長向量。
https://ithelp.ithome.com.tw/upload/images/20230927/20160630V04AbniAGu.png
圖片來源: 連結


全連接層(Fully Connected Layer):

全連接層也稱為密集層(Dense Layer),其實就類似於前面講過深度神經網絡DNN。此層經過計算學習以進行最終的分類、回歸或其他任務。能夠將高維特徵轉換為較適合的輸出,並學習特徵之間的複雜關係。


最後來統整一下捲積神經網路CNN的優缺點

優點

擅長偵測圖像,視訊數據的特徵。
對平移、旋轉等操作有一定的不變性。
集中處理圖像中局部重要特徵並保留。

缺點

計算成本高,需要大量記憶體。
數據量不足容易有過擬和的狀況。
訓練過程是不可視的,所以難以解釋模型的學習。


上一篇
Day11 捲積神經網路(Convolutional Neural Network) 上篇
下一篇
Day13 循環神經網路(Recurrent Neural Network)
系列文
AI語音模型訓練: machine learning 和 deep learning 的學習與應用30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言