iT邦幫忙

2023 iThome 鐵人賽

DAY 21
0
AI & Data

AI白話文運動系列之「A!給我那張Image!」系列 第 21

CNN經典論文導讀(四)--自編碼器(Autoencoder)後篇

  • 分享至 

  • xImage
  •  

前言

昨天我們聊到了非監督式學習,也提到可以利用Autoencoder來提取出低維度的特徵,概念上很簡單,可是視應用情況不同,Autoencoder可以有很多變形,今天我們會介紹最常見的三種!

先備知識

  1. Autoencoder的核心概念(可以回顧前篇:https://ithelp.ithome.com.tw/articles/10334832)

看完今天的內容你可能會知道......

  1. 常見的Autoencoder架構有哪些,有甚麼差別

一、Overview

1. 一般Autodencoder(AE)

  • 正如我們昨天介紹的一樣,Autoencoder最基礎的架構就是上圖最上面所示,通過反覆學習「高維度特徵到低維度特徵」的過程(編碼器的任兩層之間都是這種關係:高維度->低維度),最終就可以根據我們的設定,將一張輸入影像壓縮到指定大小的低維度特徵。具體的架構上我們可以看到一對「編碼器(Encoder)」與「解碼器(Decoder)」。
  • 看到這裡有人會納悶說,為甚麼要用編碼跟解碼來形容這樣的過程,這是因為在傳統的訊號處理領域中,編碼指的是將訊號轉換為另一格式的動作,轉換的目的可以有很多種,舉凡為了速度、為了保密又或者是為了壓縮,我們會因為各式各樣的目的將訊號轉換成某種特定的格式,這個過程跟我們透過Autoencoder在做的事情簡直一模一樣,又或者可以說本該如此,畢竟Autoencoder一開始就是為了訊號處理的目的誕生的,只是我們現在在介紹的時候將範圍縮小在CNN與影像處理上而已。
  • 這邊需要強調的是,Autoencoder是個概念,只要是這樣結構的模型我們都可以稱做是Autoencoder,不管中間我們是利用CNN實現,或是利用MLP實現都可以。

2. Denoising Autoencoder(DAE)

  • Autoencoder中有個非常經典的應用:去除噪音,這個噪音不是我們一般生活中形容別人很吵的噪音,而是訊號處理當中的噪音,舉例來說,如果一張圖片有浮水印在上面的話,這個浮水印就可以被視為是某種噪音。如果是對影像處理有些概念的人可能還會聯想到另一個例子:模糊的圖片或是有噪點的圖片,這兩者都是一般正常影像上加上特定噪音所產生的結果。
  • 有時候我們會因為設備或環境因素,沒辦法取得很好的圖片,這時候如果想要得到一張正常的圖片的話,就要經過「降噪(Denoising)」處理,傳統上有很多演算法專門在處理這樣的問題,隨著機器學習/深度學習技術的發展,也讓許多人嘗試讓模型來幫我們處理噪音,Autoencoder就是一種方式。
  • 從上圖我們可以看到DAE的架構與一般AE沒有太大的區別,最主要的差異在於輸入影像的不同,一般的AE輸入的圖片就是我們希望模型生成的圖片,而DAE的輸入圖片則會是一般圖片隨機加上某種特定的噪音,這樣的目的在於透過對資料的擾動,讓模型可以學到抗干擾的能力,如此一來就算我今天輸入的圖片是帶有噪音的圖片,模型也要能還原出一張正常的圖片。

3. Variational Autoencoder(VAE)

  • 與一般的AE不同,VAE在結構上有很大的變化,目的在於讓模型更具有彈性。一般的AE架構中,我們會將每一張圖片壓縮成低維度特徵,接著再從這樣的特徵還原成一張輸出圖片,現在問題來了,如果我輸入的圖片跟訓練實用的圖片有很大的差異的話,那麼我是不是很難得到正確的輸出圖片?
  • 就好比讓我們查字典一樣,老師只告訴我們要學習字典當中第1、11、21、31頁的內容,而今天考試的時候出現的單字卻是來自於第15頁的,這個時候如果要我們利用這個單字造句,我們應該很難寫出漂亮的句子吧!
  • VAE為了處理這樣的問題,它不再單純學習固定的低維度特徵,而是學習「特徵的分布」,這樣我們就可以從一個分布中抽樣出很多種不同的低維度特徵。
  • 這個部分將較於上面的內容來說稍微複雜一點,我們會把更詳細的內容補充在番外篇,如果沒有特別需要使用到這種架構的話,只需要知道AE也有這種變形、和一般的AE差在哪裡就可以了。

二、總結

  • 今天我們介紹了三種常見的Autoencoder架構,在接下來的實戰中,我們會利用CNN建立出一個Autoencoder架構來試試看生成出跟輸入影像一樣的圖片,通過實際跑一次程式來體驗一下Autoencoder的運作方式!

上一篇
CNN經典論文導讀(四)--自編碼器(Autoencoder)前篇
下一篇
番外篇--AI中的機率統計與VAE
系列文
AI白話文運動系列之「A!給我那張Image!」30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言