[實戰系列] 使用 Keras 搭建一個 CNN 魔法陣（模型）

2019 iT 邦幫忙鐵人賽

DAY 13

AI & Data

英雄集結：深度學習的魔法使們系列第 13 篇

2019鐵人賽 deep learning cnn keras ai

莉森揪

2018-10-28 14:11:12

53461 瀏覽

分享至

[魔法陣系列] Convolutional Neural Network（CNN）之術式解析中提到 CNN 由下列所組成：

Convolution Operation
Pooling
Fully Connected Networks

本文應用這些概念，透過 Keras 實作 CNN 模型。用 Keras 的原因是因為它是高度抽象的深度學習框架，簡單易用，直觀的程式也能幫助各位見習魔法使理解。

執行環境版本

Keras 2.0.8
Python 3.6.3

資料集

貓跟狗的圖片

模型任務

貓狗辨識模型

Step 1&2 - Convolution Operation & Pooling

input_shape 讓輸入的影像有一致的格式，程式中的 3 是指 R/B/G 三個通道
activation function 設定為 ReLU （註：在[魔法陣系列] 王者誕生：AlexNet 之術式解析有介紹過 ReLU 的優點。）
用 max pooling，作用是降躁跟減少運算資源，設為 2 * 2 尺寸
一個 Convolution Operation 搭配一個 Pooling

# Import Keras libraries and packages
from keras.models import Sequential  #用來啟動 NN
from keras.layers import Conv2D  # Convolution Operation
from keras.layers import MaxPooling2D # Pooling
from keras.layers import Flatten
from keras.layers import Dense # Fully Connected Networks

# initializing CNN
model = Sequential()  
model.add(Conv2D(32, 3, 3, input_shape = (128, 128, 3), activation = 'relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))

同理，搭建第二層與第三層的 Convolutional Layer：

# Second convolutional layer
model.add(Conv2D(32, 3, 3, activation = 'relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))

# Third convolutional layer
model.add(Conv2D(64, 3, 3, activation = 'relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

Step 3 - Flatten

將 feature maps 攤平放入一個向量中

model.add(Flatten())

Step 4 - Fully Connected Networks

前面一開始建了 32 個 feature maps, 之後 conv, max-pool, flatten 後得到大型的vector(有很多input node)，所以這邊隱藏層的 node 數目不能太小，太小可能模型不好，太大可能會花費巨大運算資源。這篇暫時先設定為 128 個 node。

謎之暴風龍：參數的設定依據不同的任務而調整，提醒大家在 NN 的參數調校中，沒有一個完美的參數配置。

由於本次任務是二元分類，辨識是貓或是狗，所以輸出層用 sigmoid function，output node 為 1。（註：在[魔法陣系列] 王者誕生：AlexNet 之術式解析中有提到 sigmoid 的功能。）

model.add(Dense(output_dim = 128, activation = 'relu'))
model.add(Dense(output_dim = 1, activation = 'sigmoid'))

Step 5 - Compiling the CNN

optimizer 是選擇優化梯度下降的演算法，使用 adam （註：[精進魔法] Optimization：優化深度學習模型的技巧（中）提到 Adam 是實務上常用的方法。）
loss 是選擇 loss function，這邊使用 binary_crossentropy
最後一個是選擇 performance metric

model.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])

Step 6 - Fitting the CNN to the images

透過 ImageDataGenerator 做 data augmentation 來減少 overfitting

from keras.preprocessing.image import ImageDataGenerator
      
train_datagen = ImageDataGenerator(rescale = 1./255, shear_range = 0.2, zoom_range = 0.2, horizontal_flip = True)
test_datagen = ImageDataGenerator(rescale = 1./255)
training_set = train_datagen.flow_from_directory('dataset/training_set', target_size = (128, 128), batch_size = 32, class_mode = 'binary')
test_set = test_datagen.flow_from_directory('dataset/test_set', target_size = (128, 128), batch_size = 32, class_mode = 'binary')
model.fit_generator(training_set, samples_per_epoch = 400, nb_epoch = 30, validation_data = test_set, nb_val_samples = 100)

Step 7 - Making new predictions

輸入一張圖，看模型的預測是否正確的程式

import numpy as np
from keras.preprocessing import image

test_image = image.load_img('dataset/single_prediction/cat_or_dog_1.jpg', target_size = (128, 128))
test_image = image.img_to_array(test_image)
test_image = np.expand_dims(test_image, axis = 0)
result = model.predict(test_image)
training_set.class_indices
if result[0][0] == 1:
  prediction = 'dog'
else:
  prediction = 'cat'