Day 8：神經網路訓練的穩定術 —— 批次與正規化

2025 iThome 鐵人賽

DAY 7

AI & Data

從入門村到最終 BOSS：30 天打通深度學習主線系列第 8 篇

17th鐵人賽

RKTT

2025-09-23 23:46:18

51 瀏覽

分享至

我原本昨天寫好發完的...結果今天被通知段賽...不知道甚麼問題
昨天我們把神經元堆疊成多層，終於組出了一個能處理更複雜問題的「冒險隊伍」。
但是光有隊伍還不夠，訓練過程中會遇到數值不穩、學習卡住的狀況。
今天我們就要學習兩個超實用的技巧 —— 小批次訓練和正規化，幫模型維持戰鬥狀態！

一、為什麼需要這些技巧？

在訓練神經網路時，有兩個經典問題：

梯度爆炸：數值在層與層之間越傳越大，最後失控。

梯度消失：數值一層層傳遞後幾乎變成 0，模型完全學不起來。

這就像冒險者在打怪時，如果沒有補血補藍，不是血量爆掉就是空藍打不出招。

二、小批次訓練（Mini-Batch Training）

在更新權重時，有三種方式：

整批訓練 (Batch Gradient Descent)

一次用所有資料更新權重

穩定，但太慢、太吃記憶體

單筆訓練 (Stochastic Gradient Descent, SGD)

每次只用一筆資料更新

噪音大，結果很抖動

小批次訓練 (Mini-Batch SGD)

每次用一小部分資料（例如 32、64 筆）

結合穩定與效率，是現在的主流做法

三、正規化（Normalization）

就算用了小批次，數值還是可能因為層數過深而不穩定。這時候就需要正規化來幫忙。

Batch Normalization (BatchNorm)

對每個小批次的輸入做標準化（均值為 0，方差為 1）

讓不同批次的數據分佈更穩定

好處：加速收斂、減少過擬合

Layer Normalization (LayerNorm)

對每一層的神經元做標準化

特別適合序列模型（RNN、Transformer）

Day 7 從單顆到多層 —— 神經網路的雛形 (二)

Day 9 神經元 (Neuron) 重點整理

系列文

從入門村到最終 BOSS：30 天打通深度學習主線共 15 篇

RSS系列文訂閱系列文

0 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19796 篇

完賽人數

529 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

從入門村到最終 BOSS：30 天打通深度學習主線系列 第 8 篇