一個打算在一個月內修完吳恩達教授在 Coursera 上的 DeepLearning specialization (Course 4: Convolution Neural Network / Course 5: Sequence Models)的瘋狂行程,並使用 Tensorflow 建立視覺與自然語言常用的模型(讀者請注意,請不要輕易嘗試這個瘋狂課程表,因為筆者已經事先聽過大部分的 lectures 了,而且曾修過相關主題的課程,並且是 tensorflow 幼幼班使用者)。
Neural language model with Feed Forward Network: 下圖的投影片截圖是在 2003 年所發表的類神經網路語言模型,...
在之前的文章中,我們不停地提到 Word embedding 的概念。一個簡潔的定義便是將離散的字詞表示(如使用 one-hot encoding)映對到新的特...
Sequence generation model 和影像生成不同的是,序列型資料因為有時序的連續性,所以使用 GAN 的方法來生成序列是較少見的。但和影像生成...
Beam Search 在之前的貼文有提到機械翻譯的 Seq2Seq 架構中,分為 training 和 inference 兩個步驟。在訓練過程中,模型會經由...
Neural Machine Translation training model 先來簡單複習一下一個 Seq2Seq 架構中的 Neural Machine...
下圖是利用之前提到的 Seq2Seq 來做影像文字註解: 在之前幾篇藉由機械翻譯作為例子而介紹的 Seq2Seq 架構,使得以兩種不同的特徵空間表示法,得以透...
在 RNN 這系列的貼文中,我們先介紹了RNN 的架構,以及為何這個架構適合用於模擬序列型資料。同時,我們也提到 RNN 架構在使用梯度方法做最佳化處理較長序列...
由現行深度學習架構概況 一文中,可以發現目前深度學習的架構相當多種,並各有其特色。但這樣百家爭鳴的情況,卻引發了如巴別塔危機的混亂狀況。 這種情況更由於影像模型...
在現行深度學習架構概況 中,提到現形深度學習架構面臨的第一個問題則是如何在異質化的計算系統上做計算速度上的最佳化。而在深度學習架構的主要成分介紹一文中,我們則簡...
在前幾篇文章中,大略提到了深度學習架構中所用的計算圖,以及計算圖如何來幫助在異質化的計算平台中達到優化的高速計算。接著,我們將要介紹一個由 University...