iT邦幫忙

2025 iThome 鐵人賽

DAY 21
0
AI & Data

AI、機器學習以及深度學習的語言學應用系列 第 21

Day 21 - Deep Learning Models(深度學習模型)

  • 分享至 

  • xImage
  •  

在前幾天,我們介紹了 Decision Tree(決策樹) 和 Naive Bayes(貝氏分類器) 等傳統的機器學習模型(Machine Learning Models)。
這類模型主要是透過人工建立的特徵以及演算法來學習資料的內容,有時候還需要人工介入來調整錯誤或改善效果。

但隨著資料量愈來愈龐大、任務愈來愈複雜,我們需要更有「自我學習能力」的模型,也就是今天要進入的 —— 深度學習模型(Deep Learning Models)。

深度學習模型運用更複雜、模仿人類大腦結構的神經網路(Neural Network)來進行學習,能夠自動從大量資料中提取特徵、找出模式,不太需要我們人工去干預。

接下來我們就來認識一下「深度學習」!(為接下來幾天的主題鋪路😏)


深度學習是什麼

  • 深度學習利用大量的資料與多層的 神經網路(Neural Network) ,自動學習出資料中的特徵與規律
  • 我們不再需要手動設計特徵或定義規則,因為模型本身就能透過層層的運算,自動抽取資訊並進行判斷
  • 簡單來說,機器學習是讓電腦學會我們設計出的規則,但是深度學習是讓電腦自己找出規則

神經網路(Neural Network)

  • 神經網路(Neural Network)為深度學習的核心
  • 神經網路是一種受人類大腦神經系統啟發設計的人工智慧(Artificial Intelligence)計算模型
  • 它由大量類似「神經元(Neuron)」的節點組成,這些節點通過層狀結構相互連接
  • 神經網路的目的是透過這些節點之間的互動,學習、分析並預測數據

結構

神經網路的結構通常包含:

  1. 輸入層(Input Layer):接收資料(例如圖片像素、文字向量)
  2. 隱藏層(Hidden Layers):進行多層次的特徵抽取與轉換
  3. 輸出層(Output Layer):產出預測結果(例如分類標籤)
  • 輸入層、隱藏層和輸出層,每個節點會對輸入資料進行處理,並將資料傳遞到下一層
  • 這種架構能讓神經網路自行從大量資料中學習和抓取特徵,進而進行分類、預測等任務

深度學習常見架構、模型

根據任務類型的不同,深度學習模型發展出了許多不同的架構:

  • CNN(Convolutional Neural Network):擅長處理影像、視覺資料(visual)
  • RNN(Recurrent Neural Network):專門處理序列資料(如文字、語音)
  • Encoder–Decoder 架構:用於「輸入一個序列、輸出另一個序列」的任務(例如:翻譯)
  • Transformer:基於「注意力機制(Attention)」的現代架構,是目前 NLP 與生成式 AI 的核心

小結

深度學習當中的神經網路模擬人腦神經元的運作原理,是目前人工智慧和深度學習技術的核心基礎,並且它推動了像 ChatGPT 這樣的大型語言模型及其他AI應用的發展。

後面幾天我將會來介紹像是 RNN、The Transformer 這些跟深度學習有關的模型架構,敬請期待~~~

Reference 1
Reference 2
Reference 3
Reference 4


上一篇
Day 20 - Cross-Entropy Loss Function
下一篇
Day 22 - RNN(循環/遞歸神經網路)
系列文
AI、機器學習以及深度學習的語言學應用30
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言