所謂深度學習是一個擁有多層次的類神經網路,也是AI進60年來最大的突破,使得AI能夠看的見、聽的到。
1.網路架構方面分為以下兩點:
深度多層次的ANN:
深度學習是ANN的一種,相對於淺層的ANN,深度學習疊較多層次(一般約大於7層。由於傳統淺層式的ANN成效並不好,甚至不如傳統的機器學習,因此,學者們才會創造出深度學習,深度學習因為特徵一層一層的向上整合,下層的Output變成上一層的Input,不斷的組成,使抽象層次能更接近真實世界的高階綜合指標(Composite Index)。
巨大且複雜的網路結構:包含以下特色
(1)非常大量的Input:深度學習可接受誤陷大的Input。
(2)非常大量的節點(函數):每個深度學習的節點都為函數,在函數中,深度學習可以透過反向的BP調整每一個函數的權重。
資料處理方面:
可同時處理不同型態的資料,例如:可同時輸入半結構化、結構化、非結構化的資料。
特徵工程:包含以下兩點
(1)特徵值的選擇:深度學習的特徵由機器自行創造,例如人臉辨識,深度學習由輸入的去層層組合成數百萬的特徵值,而這些特徵值是人類肉眼無法辨識的稱為所謂「暗知識」(Dark Knowledge),由於數量多、組合層次高,因此辨識人臉的精確度比人為判斷更為準確。
(2)特徵值往上迭代的延伸與組合:深度學習可以由底層片段的簡單基礎特徵,不斷的往上整合成抽象層次更高、整合程度更高、更接近現實世界的所謂延伸性變數(Derived Variable)且下一層的output就變成上一層的input不斷的迭帶往上,也因為這些逐漸精進、極為複雜的綜合指標,來達到用複雜的模型來解釋真實的複雜世界。例如:用身高或體重的個別變數來預測高血壓,也不如用BMI值來預測。
訓練優化方面
(1)深度學習需要巨量的訓練資料:因訓練模式非常複雜且龐大,因此需要巨量資料來訓練。
(2)深度學習能夠不斷透過回饋進行自身的優化:透過向候傳播機制與梯度下降法不斷的往後調,找到最好的下山路徑,自動提升模型以提升模型的準確度。
參考資料
人工智慧-概念應用與管理 林東清 著