iT邦幫忙

2018 iT 邦幫忙鐵人賽
DAY 12
0
AI & Machine Learning

探索 Microsoft CNTK 機器學習工具系列 第 12

MNIST 手寫數字資料集:卷積神經網路

Introduction

我們使用 MNIST 資料集訓練一個捲積神經網路。

捲積神經網路(Convolutional Neural Network, CNN / ConvNet),是一種前饋人工神經網路,與多層感知器(MLP)相似。

自然場景中,我們透過形狀、大小和顏色來辨識不同物體,而這些物體通常由邊緣(egdges)、角(conrner)、顏色(colors)區塊等基礎元素組成。
特徵檢測通常使用不同的檢測器,邊緣檢測、角檢測、顏色檢測的結合來識別,實現電腦視覺的圖像解讀,例如對象分類、區域檢測、場景描述。

檢測通常是透過濾波器(fileter)做預先處理,濾波器是一組數學函式,常見的有高斯(Gaussian)、拉普拉斯(Laplacian)、Canny。
圖像輸入濾波器(fileter)後,輸出圖像中的邊緣(egdges)、角(conrner)、顏色(colors)區塊等基礎元素,通過非線性激活函式轉換以模擬神經元。

卷積神經網路,提供了一種機器學習的濾波器方法,而不是指定一個的數學模型。
機器學習的方法,以訓練濾波器(fileter)的權重替代訓練全連接層(Fully connected layer)的權重,大幅的減少需要訓練的權重數量。

卷積神經網路的概念已經被證明和大腦中的視覺皮層有相似的部分。

視覺皮層上有一區域稱為視覺感受野(receptive field, RF)在收到刺激時會做出反應,等效於濾波器(fileter),常見的卷積神經網路(Convolutional Neural Network, CNN / ConvNet)如 AlexNet、VGG、Inception、ResNet 都有相同的概念。


上一篇
MNIST 手寫數字資料集:多層感知器
下一篇
時間序列
系列文
探索 Microsoft CNTK 機器學習工具30

尚未有邦友留言

立即登入留言