LSTM循環神經網路是一種改良一般循環神經網路的時間循環神經網路.它的出現便是為了解決循環神經網路中,難以保持長期記憶的這個問題.Google公司也利用LSTM循環神經網路來進行Google翻譯的開發,Apple、微軟以及Amazon也利用LSTM循環神經網路來進行自家產品的開發,而LSTM循環神經網路結合卷積神經網路(CNN)改進了圖像自動標註.
下圖為一個簡單的LSTM循環神經網路的架構:
LSTM循環神經網路並不是指它能夠將循環神經網路運算過程中所以的資料都記起來,而是它透過特殊機制中的閥(gate)去決定輸入是否重要到需要被記住及要不要被輸出.
LSTM主要由四個單元構成: