iT邦幫忙

2023 iThome 鐵人賽

DAY 13
0
AI & Data

嘗試在AI世界闖蕩系列 第 13

Day 13 深度學習與主要的神經網路-3(深度學習)

  • 分享至 

  • xImage
  •  

深度學習DL

  • 特色:https://ithelp.ithome.com.tw/upload/images/20230924/20163102yeADFf7m7J.jpg

➋資料處理方面

  • 可以同時處理不同型態的資料:非結構化、半結構化、結構化的資料。

➌特徵工程Feature Engineering方面

  • 包括兩點:(1)特徵值的選擇:一個模式預測的準確度,主要來自其是否掌握到最能精準預測到結果的特徵值。
    (2)特徵值往上迭代的延伸與組合:可以由底層片段的簡單基礎特徵,不斷往上整合成抽象層次更高,整合程度更高、更有區別立、更接近現實世界的所謂延伸性變數Derived Variable(隱藏特徵Latent Feature)且下一層的output就變成上一層的input不斷迭代往上,來達到用複雜的模式來解釋真實的複雜世界。
    ex.用身高或體重的個別變數來預測高血壓,還不如使用BMI來預測準確

*暗知識Dark Knowledge:極為複雜的特徵值是人類說不出來也不知道其存在甚至看不懂的。

  1. 資料的清理:資料缺失值(與目標資料間缺失大於閥值則清除)、異常值清理。
  2. 特徵過濾:對原始資料進行一系列特徵工程處理,將每一屬性(欄位)提煉為特徵。

➍訓練優化方面

  1. 深度學習需要巨量的訓練資料:DL的訓練模式非常複雜且龐大,內部常常牽涉到數千萬個、上億個節點與參數。
  2. 深度學習能夠不斷透過回饋進行自身的優化:透過BP與GD部段往後微調,找到最佳路,自動修正模型以提升模型的準確度。

深度學習優缺點

優點:

  1. 可以處理非結構的資料(ex.語音、圖像、文字、影片)
  2. 準確度高:特別是在處理非結構性資料相比傳統機器學習準確度更高。(ex.圖像辨識方面、語音辨識方面、語言翻譯方面、語言生成方面)
  3. 可移轉性:利用遷移式學習Transfer Learning,使用已經訓練好的相關模型快速移轉處理新的問題。
  4. 學習力強:BP、GD利用誤差極小化Error Minimization方式,不斷調整權重、優化、學習來提升準確度。

缺點:

  1. 不可解釋性:DL極為複雜,內部牽涉到十幾層,幾億個參數權重。
  2. 訓練成本極高
  3. 硬體與計算能力需求極大:建置成本極高,包含CPU、GPU、TPU等。

參考來源:人工智慧:概念應用與管理 林東清


上一篇
Day 12 深度學習與主要的神經網路-2(ANN學習原理、深度學習特色、架構)
下一篇
Day 14 深度學習與主要神經網路-4(深度學習-CNN)
系列文
嘗試在AI世界闖蕩31
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言