Day 9 - Web仔從數學角度學習深層前饋式神經網路DFNN - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2024 iThome 鐵人賽

DAY 9

0

AI/ ML & Data

Web仔從數學角度學習 AI/ ML & Data系列第 9 篇

Day 9 - Web仔從數學角度學習深層前饋式神經網路DFNN

16th鐵人賽

團隊真素有料

2024-09-21 20:20:50

309 瀏覽

分享至

註：本文同步更新在Notion!（數學公式會比較好閱讀）

深層前饋式神經網路（Deep Feedforward Neural Networks, DFNN）是前饋式神經網路的一種擴展。與多層感知機（MLP）相似，DFNN 由多層神經元組成，但特點在於隱藏層的數量較多，通常有多層隱藏層，因此被稱為「深層」網路。這樣的深度讓它能夠處理更加複雜的模式和數據結構。

DFNN 的目的是通過多層隱藏層的神經元來提取更高層次的數據特徵。這些特徵的提取過程從底層開始，逐層提取出更加抽象的數據信息，從而能夠學習和表示更複雜的模式。

1. 前饋過程

2. 激活函數

在每層的神經元中，激活函數 $\sigma$ 是一個關鍵組件，它能夠引入非線性，使網路能夠學習複雜的非線性映射。常見的激活函數有：

ReLU（Rectified Linear Unit）:
Sigmoid:
Tanh:

深度與特徵提取

多層隱藏層允許 DFNN 提取更加抽象的特徵。每一層的神經元在進行線性變換和非線性激活後，可以捕捉到數據中不同層次的模式。隨著層數的增加，網路能夠更好地描述數據中的複雜關係。

4. 倒傳遞演算法（Backpropagation）

DFNN 的訓練過程主要依賴於倒傳遞演算法（Backpropagation），該演算法通過計算每一層的梯度來更新權重和偏置。其目標是最小化損失函數，通常使用梯度下降法來調整網路的參數。

5. 梯度消失問題與深度網路

當網路層數增加時，傳統的激活函數（如 Sigmoid 和 Tanh）容易出現梯度消失問題，這使得網路在訓練過程中無法有效更新權重。為了解決這個問題，深層網路中通常使用 ReLU 激活函數，這種函數在輸入大於零的區域內能夠保持非零梯度，從而能夠緩解梯度消失問題。

深層前饋神經網路的優勢

複雜模式識別：由於其深度，DFNN 能夠提取和學習數據中的高度抽象特徵，使其在圖像識別、語音處理和自然語言處理等任務中表現出色。
非線性映射：激活函數的使用賦予 DFNN 強大的非線性映射能力，能夠處理複雜的數據關係。
可擴展性：DFNN 能夠隨著隱藏層的增加而提升模型的表現，這使得它在大規模數據和高維度特徵中能夠取得良好的效果。

Day 8 - Web仔從數學角度學習前饋式神經網路多層感知機MLP

Day 10 - Web仔從數學角度學習前饋式神經網路的梯度下降方式

系列文

Web仔從數學角度學習 AI/ ML & Data 共 30 篇

目錄

RSS系列文訂閱系列文

2 人訂閱

完整目錄

熱門推薦

{{ item.subject }}

{{ item.channelVendor }} | {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19860 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙