iT邦幫忙

2024 iThome 鐵人賽

DAY 13
0
AI/ ML & Data

深度學習的學習之旅:從理論到實作系列 第 13

[Day 13] 從機器學習到深度學習:人工智慧的下一步

  • 分享至 

  • xImage
  •  

前言

前幾天將一些簡單的機器學習方法及實作完成了,接著我們將開始新的篇章深度學習,讓我們繼續往下更深入的了解人工智慧的奧秘吧!

什麼是深度學習

那甚麼是深度學習哩?他跟機器學習有甚麼關係?其實很簡單,人工智慧、機器學習、深度學習這三者的關係可以參考下面這張圖。
image
可以看到,深度學習其實是機器學習中的一個集合,是實現人工智慧 (AI) 的一種方法,可以讓電腦以受人腦啟發的方式來處理資料。深度學習模型可識別圖片、文字、聲音和其他資料的複雜模式,藉此產生更準確的洞察和預測。而之所以叫做深度學習,是因為它通常包含了多層神經網絡。

深度學習如何運作

深度學習模型其實就是模仿人類大腦的神經網路來運作的,目的是持續從數據中進行學習。這個過程透過「人工神經網路」進行,這種網路的設計靈感來自於大腦中的神經元連接,能夠捕捉和理解數據中更加複雜和深層的模式。這使得深度學習模型比傳統的機器學習模型更強大,特別是在處理大量複雜數據時表現得更好。

深度學習模型依賴於多層神經網路,這些網路通常包含輸入層、隱藏層(可以有多個)、和輸出層。每一層的神經元通過權重和激活函數進行連接和計算,逐層提取數據的高階特徵,是不是看了還是看不懂這是什麼呢?不用擔心,明天開始會一步一步帶大家更加深入了解。

跟機器學習有甚麼差異

那究竟深度學習跟機器學習之間有甚麼差異?首先最基本的當然就是上面提到的,深度學習是機器學習上的一個分支,而深度學習是以「層」的概念來建構演算法。

  • 模型結構
    • 機器學習:通常包括多種演算法,例如之前提到的線性回歸、決策樹、支持向量機(SVM)和k近鄰演算法等。這些演算法通常依賴於特徵工程,也就是需要人工設計特徵來提高模型表現。
    • 深度學習:基於神經網路,特別是深度神經網路(DNN)。深度學習模型能夠自動從原始數據中提取特徵,減少了特徵工程的需求。
  • 特徵提取
    • 機器學習:依賴於人工設計特徵,這需要專家知識和經驗。特徵提取過程通常是獨立於模型訓練的。
    • 深度學習:自動進行特徵提取。多層隱藏層可以逐層提取更高層次的抽象特徵。
  • 計算資源
    • 機器學習:通常需要較少的計算資源。許多傳統的機器學習算法可以在普通的計算機上快速運行。
    • 深度學習:需要大量的計算資源,特別是GPU來加速計算,因為訓練深層神經網絡需要進行大量的矩陣運算。
  • 應用領域
    • 機器學習:廣泛應用於分類、回歸、聚類和降維等任務。
    • 深度學習:特別擅長於處理高維數據和非結構化數據,如圖像、語音和自然語言處理。深度學習在圖像識別、語音識別和自然語言處理等領域取得了顯著的成功。

深度學習模型

在深度學習有幾個常見的模型,在之後幾天我再詳細的介紹這幾個模型,並在最後幾天來用實作來完成。

  • 卷積神經網路(Convolutional Neural Networks, CNN)

    • CNN主要用於圖像處理和計算機視覺任務。它通過卷積層、池化層和全連接層來提取圖像中的空間特徵。典型應用包括圖像分類、物體檢測和圖像分割。
  • 循環神經網路(Recurrent Neural Networks, RNN)

    • RNN適用於處理序列數據,如時間序列和自然語言。它具有內部記憶能力,可以記住先前的輸入。常見變種包括長短期記憶網路(LSTM)和門控循環單元(GRU),它們能夠更好地解決長期依賴問題。
  • 生成對抗網路(Generative Adversarial Networks, GAN)

    • GAN由兩個網路組成:生成器(Generator)和判別器(Discriminator)。生成器試圖生成逼真的數據,而判別器則試圖區分生成數據和真實數據。兩者之間的對抗學習促使生成器生成越來越真實的數據。

結語

今天跟機器學習的入門一樣提到了很多深度學習的概念,在未來幾天我會補充這些提到的模型,像是CNN、RNN,並搭配實作來讓大家明白深度學習的概念。


上一篇
[Day 12]強化學習實戰最終章:FrozenLakeAgent 完整訓練與評估展示
下一篇
[Day 14] 人工智慧的核心:類神經網路
系列文
深度學習的學習之旅:從理論到實作30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言