前面我們認識了什麼是MNIST手寫數字資料集,知道如何查看印出資料內容,也學會怎麼把資料做好預處理,接下來就要進入重要的階段,也就是建立模型、訓練模型,最終可以使用模型對資料進行預測。
先來淺談什麼是多層感知器模型,多層感知器模型(Multilayer perceptron, 簡稱MLP)是一種前向結構的類神經網路,也可以說是一種機器學習的解決方案,基本結構通常包含一個輸入層、一至多個隱藏層、以及最後的輸出層,之前提過的反向傳播演算法也經常被利用來訓練MLP。由於現今深度學習是相當熱門的議題,MLP也被廣泛應用在圖像辨識、語音識別、機器翻譯等多項領域中。
多層感知器模型的運作方式,大致如下圖所示:
需要建立好多層感知器模型後,再藉由資料訓練模型,才能逐步達到用模型進行預測或辨識的目標。今天我們就先練習實作建立模型的步驟:
進行資料預處理
由於這個部分我們在前一篇做過介紹了,這邊就簡略的帶過:
建立模型
我們預計建立的多層感知器模型如本篇的第一張圖片,輸入層x有784個神經元,隱藏層h有256個神經元,輸出層y有10個神經元。
匯入所需的模組:
建立Sequential線性堆疊模型,方便之後加入各個神經網路層:
建立輸入層與隱藏層,並加入Dense神經網路層:
建立輸出層,並加入Dense神經網路層:
查看目前模型的摘要及欄位: