一個打算在一個月內修完吳恩達教授在 Coursera 上的 DeepLearning specialization (Course 4: Convolution Neural Network / Course 5: Sequence Models)的瘋狂行程,並使用 Tensorflow 建立視覺與自然語言常用的模型(讀者請注意,請不要輕易嘗試這個瘋狂課程表,因為筆者已經事先聽過大部分的 lectures 了,而且曾修過相關主題的課程,並且是 tensorflow 幼幼班使用者)。
在介紹 Inception network 時,必須提到另外一個與 VGG 架構完全不同但在表現上一樣出色的另一個 convolution network ,則...
物體辨識的三個主要問題: 在電腦視覺的研究中有三個主要的難題,分別是影像分類(Image classification),物件定位(Object Localiz...
昨天的文章中,匆匆地帶過了 YOLO 演算法的重要精髓,但倒底 YOLO 演算法和其他的物體辨識演算法有何不一樣呢?首先我們讓詹姆斯龐德來告訴你: 為了能了解...
Landmark detection 和物體辨識(object detection)最大的不同,在於物體辨識要從一堆被歸於同一類,但變化極多的物體影像中,學習辨...
影像風格轉換,主要是利用兩張影像的輸入,這兩張影像,一張被稱為 content 的影像,通常是由相機拍攝真實場景而成數位相片,另外一個影像輸入則被稱為 styl...
Generative model:之前我們所談的多半是 Discriminative model,亦是訓練一個分類器,判別輸入影像是否是屬於某一類的物件,或是輸...
在這一系列介紹 Convolution Neural Network 在電腦視覺的文章中,我們先了解了卷積網路的原理。也看了許多不同的類神經網路架構,以 Con...
在之前 Convolution neural network 的系列中,我們處理的都是影像資料。若是灰階影像,則轉換成矩陣,其維度為 2D,若是 RGB 影像,...
RNN 本身就是一個深度類神經網路,而原因在於它的架構中可捕捉序列資料間的相依和連續性。因為 RNN 是一個深層類神經網路,自然也有許多深度網路會遭遇的訓練問...
RNN 的網路結構,讓它得以捕捉序列之間的相依關係,而語言模型經常仰賴序列間的相依關係,來訓練最佳的模型。那麼,倒底什麼是語言模型呢? 一個語言模型會以一個單字...