線性模型 前一天我們學到了最直觀的 KNN 演算法,但他在預測時需要計算與所有訓練樣本的距離,這在數據量大時會變得非常緩慢。它並沒有真正「學習」到一個濃縮的、高...
深度學習是機器學習的一個分支,它試圖模仿人類大腦中神經網路的結構和功能來進行學習。所謂的「深 (Deep)」,通常指的就是神經網路的「層數」很多。這些層層堆疊的...
ANN 的缺點 雖然 ANN 能夠自動學習特徵,但是他在處理影像時會把二維的圖片攤平成一維的向量,這會造成空間結構資訊的喪失。ANN 沒辦法理解相鄰或上下左右這...
AlexNet 在 2012 年之前,舉世聞名的 ILSVRC (ImageNet Large Scale Visual Recognition Challen...
雖然昨天我們知道 VGGNet 在一定程度上有著網路越深、效果越好的特性,但是當研究人員把網路堆疊約 20 層以上時,模型的準確率反而開始下降。這不是過擬合所導...
雖然我們學會了怎麼用各種不同 CNN 模型來進行圖像辨認,但對他的認識仍停留在黑盒子的階段。模型在做出「這是一隻貓」的決斷時,還是不知道它是依據什麼做判斷的,而...
至今我們學習的 VGG、ResNet 等模型,它們的設計目標都是追求極致的準確率。然而,這些模型龐大的參數數量和巨大的計算量,使得它們很難被部署到手機、無人機、...
如果我們手上只有數百張貓狗的照片,是沒辦法像前幾天一樣訓練出像 ResNet 這種好的分類器,反而會遇到過擬合的問題。在這種缺乏數據的情況下,我們能用遷移學習...
現實中的視覺任務,往往遠比我們前幾天所做的圖像分類還複雜,例如物件偵測:不只要知道圖片有一隻貓,還要知道貓在哪裡。物件偵測的目標是同時在一張圖片完成兩件事...
R-CNN 系列演算法都有獲取候選區域這個步驟,然而也是因為分為兩步驟進行,雖然精準,但偵測速度受到了限制。因此另一派演算法選擇拋去這個步驟,最具代表性的模型為...