接下來將會講解深度學習(Deep Learning,DL)是什麼?但在這之前首先要來介紹一下神經網路的概念。
腦神經系統
由於類神經主要是模仿人類的腦神經所介紹,所以在此會簡單的介紹一下腦神經的各個組成。
- 神經元(Neuron):能感知環境的刺激,再將反映的信息傳遞給其他的神經元。
- 樹突(Dendrite):接受上一個神經元傳來的刺激,並傳給神經元本體。
- 軸突(Axon):神經元中間的一條電線,可將上一個神經元的化學脈衝傳遞給下一個神經元的樹突。
- 突觸(Synapse):是軸突與樹突連接處的微小空隙,是神經相接並交換訊息的空間,神經元所傳遞並分泌的化學電脈衝,稱為多巴胺,他必須達到一個特定的閥值才會將電為傳遞給下一個神經元,否則不會有神經的脈衝。
類神經網路的概念與架構
ANN基本概念
類神經網路(Artificial Neural Network,ANN)是一個模仿人類神經系統,使電腦具備了學習與推理判斷能力的一種演算法模型。
ANN主要架構與組成分子
- 節點(Node):在ANN中包含大量節點,其主要執行演算的處理單位,類似於神經元。
- 連結(Connection):類似於突觸,透過各種不同方式與其他節點連結,進而形成神經網路。
- 輸入(Input):類似於樹突,接受外界刺激。例如:圖像、文字、聲音等等。
- 權重(Weight):類似於化學電衝脈,電流強度需大過閥值才會傳出以啟動下個神經元。
- 隱藏層(Hidden Layer):夾在輸入與輸出層中間,不跟外部有直接接觸,因此稱為隱藏層,主要功能為隊所接收的資料進行「加工處理」,抽取更高層次或更具區別力的綜合指標,稱之為隱藏特徵。
- 輸出層(Output Layer):經過ANN演算處理後,最後所做出的判斷。
ANN學習原理
- 損失函數(Loss Function):指原來ANN的估計值與正確答案之間的差距,損失函數的變化是可以調整的參數,ANN的學習目的就是不斷的調整參數來達到最小化損失函數。例如:消費者信用好壞判斷錯誤後,我們就提高消費者信用卡預期繳交次數的權重,以提高判斷的準確度。
- 反向傳播機制(Backward Propagation,BP):在Output發現錯誤,由後往前一步一步調整參數的權重,直到輸出正確。
- 梯度下降(Gradient Descent,GD):為了找到接近目標的一種修正方法,會透過一步一步慢慢接近目標,最後找到一個近似目標的函數。若以山為例,山頂為目前之估計值,而山頂為目標,則GD會360度的尋找最陡的坡度,以求最快速下山。
- 遺忘層(Dropout):為了防止過度擬合問題,在每次訓練時會隨機刪除某個特定比例的網路節點,使得每次訓練都是以不同模型訓練。
參考資料
人工智慧-概念應用與管理 林東清 著