深度學習(Deep Learning)是近年來機器學習中最廣為人知的一個領域,其特點在於由電腦自行從大量資料中尋找規則,並提取特徵和模式,從而進行預測和判斷,無需專家們的介入。這使深度學習模型能夠持續學習和改進,在各種應用領域中取得卓越的成就。而深度學習之所以被稱為"深度"學習,是因為它使用了多層神經網路。每一層都包含多個神經元,資料通過這些多層的神經元進行多次非線性轉換和特徵提取,使得模型能夠學習到更高階、更抽象的特徵表示。以下將逐一介紹深度學習的常見技術:
CNN是深度學習的重要發展主力之一,它的目標是提取圖片及影片中的各個特徵。
當CNN分析新圖片時,由於不知道特徵位於何處,因此它會負責比對圖片的各部分,連邊緣及角落都不放過。以下將簡略介紹各層的功能:
(1)Input Layer: 此層類似於人體器官的"眼睛",負責圖片或影像資料。在這一層,我們的圖片將被分解成數個小區塊,每個小區塊都叫做「特徵圖」,是我們模型的起點。
(2)Hidden Layer1: 此層又被稱作為卷積層,類似於人類的"大腦",是深度學習的核心。它負責捕捉圖像的特徵,例如形狀特徵、邊緣特徵等等。它使用卷積核的小濾鏡,對輸入的圖像進行滑動操作,計算出每個區域與卷積核的相似度,並將結果在新的圖片中標出。
(3)Hidden Layer2: 此層又被稱作為池化層。它的工作是將特徵圖的尺寸縮小,並同時保留重要信息。不但可減少計算並使模型更加精準。
(4)Output Layer: 此層的工作為將池化層分析的圖片特徵轉換成最終的輸出。並根據特徵結果進行分類,輸出我們的預測結果。
RNN 的主要目標是賦予神經網絡記憶能力,使它能夠處理像文字、時間序列及語音這樣的一連串序列型資料。RNN 的特別之處在於它可以理解資料中的時間關係,就像我們在閱讀故事時能夠記住先前的情節一樣。
舉例說明: