iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 23
1
AI & Data

放課後的菜雞小學堂-深度學習30日自學筆記系列 第 23

Day 23 | 數字辨識 - 以Keras建立多層感知器模型

  • 分享至 

  • xImage
  •  

前面我們認識了什麼是MNIST手寫數字資料集,知道如何查看印出資料內容,也學會怎麼把資料做好預處理,接下來就要進入重要的階段,也就是建立模型訓練模型,最終可以使用模型對資料進行預測

先來淺談什麼是多層感知器模型,多層感知器模型(Multilayer perceptron, 簡稱MLP)是一種前向結構的類神經網路,也可以說是一種機器學習的解決方案,基本結構通常包含一個輸入層、一至多個隱藏層、以及最後的輸出層,之前提過的反向傳播演算法也經常被利用來訓練MLP。由於現今深度學習是相當熱門的議題,MLP也被廣泛應用在圖像辨識、語音識別、機器翻譯等多項領域中。

多層感知器模型的運作方式,大致如下圖所示:

需要建立好多層感知器模型後,再藉由資料訓練模型,才能逐步達到用模型進行預測或辨識的目標。今天我們就先練習實作建立模型的步驟:

  • 進行資料預處理
    由於這個部分我們在前一篇做過介紹了,這邊就簡略的帶過:

  • 建立模型
    我們預計建立的多層感知器模型如本篇的第一張圖片,輸入層x有784個神經元,隱藏層h有256個神經元,輸出層y有10個神經元。

  1. 匯入所需的模組:

  2. 建立Sequential線性堆疊模型,方便之後加入各個神經網路層:

  3. 建立輸入層與隱藏層,並加入Dense神經網路層:

  4. 建立輸出層,並加入Dense神經網路層:

  5. 查看目前模型的摘要及欄位:


上一篇
Day 22 | MNIST手寫數字辨識 (三)
下一篇
Day 24 | 數字辨識 - 訓練模型
系列文
放課後的菜雞小學堂-深度學習30日自學筆記30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言