遞歸神經網絡( RNN )

15th鐵人賽學習筆記

1798 瀏覽

遞歸神經網絡（ Recurrent Neural Network，簡稱 RNN ）

主要用於處理時間序列、自然語言文本等，RNN 的特點在於它具有記憶能力，可以處理可變長度的輸入序列，並在處理序列資料時保留先前的資訊

循環層（ Recurrent Layer ）
存在一個或多個循環層，每個循環層都具有權重和偏差還有一個隱藏狀態（ hidden state ），記錄有關之前的資訊，而隱藏狀態在每個時間步都會被更新
時間步（ Time Step ）
序列資料時被分成多個時間步，每個時間步接受一個輸入，並生成一個隱藏狀態和一個輸出
遞歸的反向傳播（ Backpropagation Through Time，BPTT ）
使用反向傳播算法進行訓練，不同於傳統神經網絡，RNN 需要在時間步之間傳播梯度

LSTM 是一種特殊的 RNN 變體，改善 RNN 在處理長序列資料時的能力
有特定的閘門機制，以控制資訊的流動，並保留長期記憶

包含三個重要的閘門

遺忘閘門（ Forget Gate ） 選擇哪些長期記憶應保留或丟棄
輸入閘門（ Input Gate ） 決定新的資訊應該被添加到長期記憶中
輸出閘門（ Output Gate ） 根據當前的輸入和長期記憶來生成模型的輸出
每個閘門都是由一個 sigmoid 函數來控制，決定哪些資訊要被保留或遺忘