iT邦幫忙

2021 iThome 鐵人賽

DAY 2
0
自我挑戰組

學姊,要不要來我家看電腦後空翻阿系列 第 2

Day2 - Yolo? 那是什麼? 能吃嗎?

  • 分享至 

  • xImage
  •  

今天要介紹的是Object detection(物件偵測)以及CNN (Convolutional Neural Network , 卷積神經網路)

首先是Object detection :
也就是物件偵測,通常會由

  • Object Localization (物件定位)
  • Feature Extraction (特徵提取)
  • Image Classification (圖像分類)
    三者組合而成,換句話說
    「哪裡有東西,這東西有啥特徵,我覺得這東西是啥」 = 我找到這東西了 !

CNN (卷積神經網路):
CNN是深度學習的其中一種架構,被廣泛的使用在物件辨識以及圖片處理等領域。

而CNN會由3個步驟組成

  • Convolution Operation (卷積)
  • Pooling (池化)
  • Fully Connected Networks (全連接)
  1. Convolutional Operation
    在第一步會進行卷積,抓取圖片中的特徵。在影像辨識時,要使用影像中的全部pixel進行辨識是不現實的。比較合理的做法是抓出影像中重要的地方,將這些特徵(feature maps)保存起來,之後才讓訓練決定特徵點的去留。

舉個例子:
https://ithelp.ithome.com.tw/upload/images/20210902/20140460kA5tscTuGa.jpg(X

如果拿JOJO中的經典人物DIO來看(不考慮子安武人的魔性配音σ`∀´)σ)
原圖是
https://ithelp.ithome.com.tw/upload/images/20210902/20140460Wq3wtQZ3uv.jpg

經過挑選後的特徵可能剩下
https://ithelp.ithome.com.tw/upload/images/20210902/20140460FKLzk3wo0X.jpg

  1. Pooling
    因為現實世界有太多的變因能夠影響影像的成像品質,而這些因素都能讓電腦出現誤判的情況,因此在池化這步將會讓神經網路有能力處理這些特徵。

現實中的變因 ᕕ ( ᐛ ) ᕗ
https://ithelp.ithome.com.tw/upload/images/20210902/20140460GeTEmwrrUR.jpghttps://ithelp.ithome.com.tw/upload/images/20210902/201404605iwdmsITdD.jpghttps://ithelp.ithome.com.tw/upload/images/20210902/2014046023aUoPKxeC.jpg

而pooling又分為:

  • Mean pooling
  • Max pooling
  • Sum pooling
    這裡用最常用的Max pooling舉例,他就是挑選出前一步產出的Feature maps矩陣內的最大值。使用Max pooling的好處是平移不會對判斷造成影響,也因為是挑最大值,所以基本上不會挑中比重小的值,自然抗雜訊能力也就好。
  1. Fully Connected Networks
    在這步(全連接網路)會把前幾步得到的網路進行平坦化(Flatten)的動作,變成一個很神奇的物體。
    https://ithelp.ithome.com.tw/upload/images/20210902/20140460sisRicWavi.png
    像這樣,經過三步之後,CNN就算是完整的介紹完了。

參考資料:
https://medium.com/@chenchoulo/yolo-%E4%BB%8B%E7%B4%B9-4307e79524fe
https://ithelp.ithome.com.tw/articles/10204738
https://ithelp.ithome.com.tw/articles/10204737
https://medium.com/jameslearningnote/%E8%B3%87%E6%96%99%E5%88%86%E6%9E%90-%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92-%E7%AC%AC5-1%E8%AC%9B-%E5%8D%B7%E7%A9%8D%E7%A5%9E%E7%B6%93%E7%B6%B2%E7%B5%A1%E4%BB%8B%E7%B4%B9-convolutional-neural-network-4f8249d65d4f


上一篇
Day1 - 前言
下一篇
Day3 - Yolo? 那是什麼? 能喝嗎?
系列文
學姊,要不要來我家看電腦後空翻阿4
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言