[神經機器翻譯理論與實作] 重新檢視有無注意力機制的Encoder-Decoder - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2021 iThome 鐵人賽

DAY 26

0

AI & Data

當自然語言處理遇上深度學習系列第 26 篇

[神經機器翻譯理論與實作] 重新檢視有無注意力機制的Encoder-Decoder

13th鐵人賽 natural language processing neural machine translation seq2seq attention mechanism

2021-10-04 23:47:55

1261 瀏覽

分享至

前言

今天是個美麗的錯誤，本來預計將昨日寫好的 Encoder 、Decoder 、 LuongAttention 類別整合進單一個繼承自 tensorflow.keras.Model 的模型類別，只可惜一直無法成功除蟲
由於 Keras API 是基於 Tensorflow 框架的高階函式庫，要自行定義模型類別，需要對於 Tensorflow 的變數型態有基本的掌握，今日就無法產出有質量的內容了。因此我後來還是選擇了直接呼叫 Keras 的 functional APIs 來建模，並比較它們在同一份文本上預測精準度的差異。

seq2seq預測準確度比較

我們一樣使用之前的英文－西班牙文雙語平行語料庫進行訓練：

使用 Luong 注意力機制的 Encoder-Decoder 訓練歷程

未使用 Luong 注意力機制的 Encoder-Decoder 訓練歷程

結語

關於 Seq2Seq 的專篇討論就到此告一段落，明天我將會重新回溯資料的準備以及機器學習的訓練及推論流程，並著手進行中文－英文語料庫的文本處理，建立翻譯器所需之訓練資料。大家晚安！

閱讀更多

Making new Layers and Models via subclassing

[神經機器翻譯理論與實作] 將Encoder、Decoder和Attention統統包起來

[神經機器翻譯理論與實作] 從頭建立英中文翻譯器 (I)

系列文

當自然語言處理遇上深度學習共 33 篇

目錄

RSS系列文訂閱系列文

28 人訂閱

完整目錄

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22211 篇

完賽人數

600 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js