[Day-12] TF.Keras api & Customized

第 11 屆 iThome 鐵人賽

DAY 12

Google Developers Machine Learning

Towards Tensorflow 2.0系列第 12 篇

11th鐵人賽 tensorflow deep learning machine learning

Dan

2019-09-27 22:35:23

17934 瀏覽

分享至

今天的話，我們來討論一下tf.keras的api。首先，今天要討論的tf.keras與我們所熟知的keras是不太一樣的，以前我們所使用的keras，他的backend其實也是用tensorflow，且Keras有自己做好的模型wrapper。而現在TF2.0 大力將keras整進去，因此今天討論的會是TF2.0下的tf.keras。一般來說，在tf.keras下，比較常使用的像是 tf.keras.layer , tf.keras.losses,tf.keras.mertrics, tf.keras.optimzer 等等。接下來，會挑幾個重要或者常用的來說明

tf.keras.metrics:

主要像是用在training model的過程，常會用以紀錄像是loss或者accuracy等等的模型數值。

假如要建立一些模型衡量指標就可以使用像是:

Model_acc = tf.keras.metrics.Accurcy()
#or
Model_mean = tf.keras.metrics.Mean()

接下來當我們要update或者說增加裡面的數值就會使用像是:

Model_acc.update_state(y,pred)
#or
Model_mean.update_state(current_loss)

之後就可以在模型裡面print出這些數值

#training steps
print(step,'Train_loss:',Model_mean.result().numpy(),'Train_Acc',Model_acc.result().numpy())

最後當每個epoch跑完要清楚裡面的數值時，可以使用像是

Model_mean.reset_states()
Model_acc.reset_states()

2.Model Define：

在Model定義裡像是我們會使用tf.keras.Sequential來包網路架構，在各層的定義就會使用tf.keras.layers來定義每一層 (Ex: neuron數、activation function等等)。最後就丟進去compile即可！

model = tf.keras.Sequential([
    tf.keras.layers.Dense(256,activation=tf.nn.relu),
    tf.keras.layers.Dense(128,activation=tf.nn.relu),
    tf.keras.layers.Dense(64,activation=tf.nn.relu),
    tf.keras.layers.Dense(32,activation=tf.nn.relu),
    tf.keras.layers.Dense(16,activation=tf.nn.relu),
    tf.keras.layers.Dense(10,activation=tf.nn.relu)
])

model.build(input_shpae=[-1,28*28])

model.trainable_variables就可以拿取model中要train的variable (Ex: weight , bias等)。

假如想要custom layer，也是可以的！在class中主要就是要實現init、call跟build的方法，然後記得要繼承tf.keras.layer。

init : 主要就是初始化，以及繼承

call:執行向前傳導

build: 輸入shape，定義viarble的等等

範例如下:

class MyDenseLayer(tf.keras.layers.Layer):
  def __init__(self, num_outputs):
    super(MyDenseLayer, self).__init__()
    self.num_outputs = num_outputs

  def build(self, input_shape):
    self.kernel = self.add_variable("kernel",
                                    shape=[int(input_shape[-1]),
                                           self.num_outputs])

  def call(self, input):
    return tf.matmul(input, self.kernel)

layer = MyDenseLayer(10)
print(layer(tf.zeros([10, 5])))
print(layer.trainable_variables)

而自定義一個網路架構也是非常類似的，但他所繼承的類別就是tf.keras.Model
Ex:


class ResnetIdentityBlock(tf.keras.Model):
  def __init__(self, kernel_size, filters):
    super(ResnetIdentityBlock, self).__init__(name='')
    filters1, filters2, filters3 = filters
 
    self.conv2a = tf.keras.layers.Conv2D(filters1, (1, 1))
    self.bn2a = tf.keras.layers.BatchNormalization()
 
    self.conv2b = tf.keras.layers.Conv2D(filters2, kernel_size, padding='same')
    self.bn2b = tf.keras.layers.BatchNormalization()
 
    self.conv2c = tf.keras.layers.Conv2D(filters3, (1, 1))
    self.bn2c = tf.keras.layers.BatchNormalization()
 
  def call(self, input_tensor, training=False):
    x = self.conv2a(input_tensor)
    x = self.bn2a(x, training=training)
    x = tf.nn.relu(x)
 
    x = self.conv2b(x)
    x = self.bn2b(x, training=training)
    x = tf.nn.relu(x)
 
    x = self.conv2c(x)
    x = self.bn2c(x, training=training)
 
    x += input_tensor
    return tf.nn.relu(x)
 
    
block = ResnetIdentityBlock(1, [1, 2, 3])
print(block(tf.zeros([1, 2, 3, 3])))
print([x.name for x in block.variables])

Model training
一般來說，Model training的api會分為四類：model.compile, model.fit, model.evaluate, model.predict。這四項。其實，這些api也很直觀，就是整個ML training的pipeline。若不用tf.keras的api，就像之前Lab一樣，要自己寫tf.GradientTape()來訓練參數。但若是在tf.keras裡面就超級方便！就像我們第一個最間單的Lab，直接下:

model.compile(optimizer='adam',
                loss='mean_squared_error',
                metrics=['mean_squared_error'])

history = model.fit(X_train.values ,y_train.values, epochs=100, validation_split = 0.1)

model.evaluate(X_val)

Save / Load Model:
一般來說，跑完model，我們會希望能把model 儲存下來，或者說跑到一半中斷想要save model，之後可以直接Load model繼續train。儲存的方式有兩種 save/load weight 、save /load model 。Save weight的方式是比較輕量級的方法，但是模型架構等等都要先定義好且相同。Save model就是直接全部存下來，不需要先定義模型架構。

#Save weight
model.save_weights('weights.ckpt')
#Load weight
model = create_model()
model.load_weights('weights.ckpt')
# save model
model.save('model.h5')
# load model
model = tf.keras.models.load_model('model.h5')