【11】二分類問題下 Binary Cross Entropy 的使用注意事項

2021 iThome 鐵人賽

DAY 11

AI & Data

30 天在 Colab 嘗試的 30 個影像分類訓練實驗系列第 11 篇

13th鐵人賽 tensorflow colab

Capillary J

2021-09-25 13:23:37

5585 瀏覽

分享至

Colab連結

接著昨天討論到的 Cross Entropy ，今天把重點放到了 BinaryCrossEntropy 上，顧名思義，之所以叫 Binary 就代表此工具主要是用於探討二元分類的問題，我們會將資料集換成 cats_vs_dogs 。

NUM_OF_CLASS = 2

train_split, ds_info = tfds.load(
    'cats_vs_dogs',
    split='train[:75%]',
    shuffle_files=True,
    as_supervised=True,
    with_info=True)

test_split, ds_info = tfds.load(
    'cats_vs_dogs',
    split='train[75%:]',
    shuffle_files=True,
    as_supervised=True,
    with_info=True)

fig = tfds.show_examples(train_split, ds_info)

print(f'number of train: {len(train_split)}')
print(f'number of test: {len(test_split)}')

實驗一: CategoricalCrossentropy

因相對 oxford_flowers102，cats_vs_dogs 問題簡單很多，所以我們把 epoch 從100降低到30個，模型很快就能夠收斂。

base = tf.keras.applications.MobileNetV2(input_shape=(224, 224, 3), include_top=False, weights='imagenet')
net = tf.keras.layers.GlobalAveragePooling2D()(base.output)
net = tf.keras.layers.Dense(NUM_OF_CLASS)(net)

model = tf.keras.Model(inputs=[base.input], outputs=[net])

model.compile(
    optimizer=tf.keras.optimizers.SGD(LR),
    loss=tf.keras.losses.CategoricalCrossentropy(from_logits=True),
    metrics=[tf.keras.metrics.CategoricalAccuracy()],
)

start = timeit.default_timer()
history = model.fit(
    ds_train,
    epochs=EPOCHS,
    validation_data=ds_test,
    verbose=True)

產出：

loss: 2.8140e-04 - categorical_accuracy: 1.0000 - val_loss: 0.0401 - val_categorical_accuracy: 0.9916

可以看到訓練非常快就收斂，第4個 epoch 就有98%的準確度。

實驗二：BinaryCrossEntropy

訓練前有一個需要注意的地方，就是在輸出的dense layer中，節點要設為1，因為兩個分類可以簡化成一個0~100%的分數，靠0%代表分類一，靠100%代表分類二。

base = tf.keras.applications.MobileNetV2(input_shape=(224, 224, 3), include_top=False, weights='imagenet')
net = tf.keras.layers.GlobalAveragePooling2D()(base.output)
net = tf.keras.layers.Dense(1)(net). # dense node = 1

model = tf.keras.Model(inputs=[base.input], outputs=[net])

model.compile(
    optimizer=tf.keras.optimizers.SGD(LR),
    loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
    metrics=[tf.keras.metrics.BinaryAccuracy()],
)

start = timeit.default_timer()
history = model.fit(
    ds_train,
    epochs=EPOCHS,
    validation_data=ds_test,
    verbose=True)

產出：

loss: 7.6595e-04 - binary_accuracy: 0.9997 - val_loss: 0.0360 - val_binary_accuracy: 0.9921

收斂速度也是非常快，得到的結果和CategoricalCrossentropy差不多。

實驗三：另類的用法，用 BinaryCrossEntropy 訓練多分類！？

我自己在嘗試 BinaryCrossEntropy 訓練貓狗分類時，一開始意外的把最後的 dense layer 節點設成2，結果也是可以訓練，所以我就好奇了，那如果我用 BinaryCrossEntropy 訓練 oxford_flowers102 的102個分類呢？

base = tf.keras.applications.MobileNetV2(input_shape=(224, 224, 3), include_top=False, weights='imagenet')
net = tf.keras.layers.GlobalAveragePooling2D()(base.output)
net = tf.keras.layers.Dense(NUM_OF_CLASS)(net)

model = tf.keras.Model(inputs=[base.input], outputs=[net])

model.compile(
    optimizer=tf.keras.optimizers.SGD(LR),
    loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
    metrics=[tf.keras.metrics.CategoricalAccuracy()],
)

start = timeit.default_timer()
history = model.fit(
    ds_train,
    epochs=EPOCHS,
    validation_data=ds_test,
    verbose=True)

產出：

loss: 0.0418 - categorical_accuracy: 0.6373 - val_loss: 0.0516 - val_categorical_accuracy: 0.2980

結果是可以的（不過要把label 做 one-hot encoding），只是訓練的成果並不太好，經過了100個 epochs 準確度不到三成就是了...。

以上就是 BinaryCrossentropy 使用上的幾個小心得，希望大家使用上時可以注意這幾點。

【10】多分類問題下 Sparse Cross Entropy 與 Categorical Cross Entropy 的用法差異

【12】新手容易忽略的 logit 與 loss 之間的搭配

系列文

30 天在 Colab 嘗試的 30 個影像分類訓練實驗共 31 篇

RSS系列文訂閱系列文

8 人訂閱

完整目錄

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22206 篇

完賽人數

600 人

FinOps - 從雲端的使用小細節，實踐雲端成本管理與優化

Cloud Summit 臺灣雲端大會 |

37 分

迎向未來體驗：雲遊戲、元宇宙

IT EXPLAINED |

40 分

我就問，跳過這些，你要敏捷去哪裡？

Agile Summit 敏捷高峰會 |

42 分

實戰 Angualr Signals

MWC |

39 分

用 Kustomization 搭配 yq 部署 K8s 容器

Kubernetes Summit |

37 分

「你成功引起我的注意了！」── 給我 30 分鐘，帶你打造吸引面試官的亮眼履歷

iThome鐵人賽 |

37 分

笑死，能關防毒幹嘛要做免殺呢？從令牌偽造到把防毒關進沙箱隔離

臺灣資安大會 |

42 分

資料庫要加密！法規怎麼說？怎麼做？

CYBERSEC NOW |

27 分

一個關於 API Gateway 的導入評估指引

Cloud Summit 臺灣雲端大會 |

30 分

Kubernetes 安全防護

Cloud Summit 臺灣雲端大會 |

25 分

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

30 天在 Colab 嘗試的 30 個影像分類訓練實驗系列 第 11 篇