前面說到深度學習(Deep Learning)是實現機器學習(ML)的一個技術,它使用的算法類似於人腦中使用神經元的方式,分為 DNN、CNN 和 RNN 三種。
為了理解計算機如何使用深度學習,研究人員借鑒了一個類似的過程:幼兒試圖學習如何識別狗?
蹣跚學步的孩子首先學會將圖片與大人所說的"狗"這個字
聯繫起來
。
孩子繼續將吠叫聲與狗聯繫起來,然後孩子開始說這個字,可能會發出幾種錯誤的發音,直到他們最終理解了這個字。
同樣,計算機具有層次結構
,每個級別的算法對輸入應用一個級別的轉換(這是它所做的學習),並創建一個統計模型作為輸出的參考。
各種迭代(就像孩子學習識別狗一樣)被考慮在內,直到達到所需的準確度水平,需要經過幾個層或特徵集才能達到最終結果,這就是為甚麼叫“深度”學習的原因!
CNN
(Convolutional Neural Network) 十分常被用在 DL 上,處理更多由影像處理延伸的辨識功能,例如"Reading text in the Wild"
→ 可以讀出視頻中的文字,只要輸入文字,就可以直接搜出圖像中包含這些文字的 BBC 新聞視頻。
以下是對「London」的一部分搜索結果: