iT邦幫忙

第 12 屆 iThome 鐵人賽

0

目前電腦辨識影像有以下幾種

  • Object Detection(物體識別)
  • Style Transfer(風格轉移)
  • Image Segmentation(圖像分割)
  • Pose Estimation(姿態估計)
  • Multiple Object Tracking(視頻跟踪)
  • Image Generation(影像生成)

https://ithelp.ithome.com.tw/upload/images/20201211/20130601ej50xtDpoj.png

Object Detection(物體識別)

物體識別指的是讓計算機(computer)去分析一張圖片或者一段視頻流中的物體,並標記出來,這需要給神經網絡大量的物體數據去訓練它才能進行識別。
Ex:在圖片中偵測出腳踏車和狗狗,並標記出來。

Style Transfer(風格轉移)

風格轉移是指一類操縱數字、圖像或視頻的軟件算法,以採用另一種圖像的外觀或視覺風格,例如將名畫的外觀轉移到用戶提供的照片上。
Ex:將梵谷的畫風轉移至照片上。(包括色調、線條粗細等。)

Image Segmentation(圖像分割)

圖像分割指的是將圖像細分為多個圖像子區域的過程。圖像分割的目的是簡化或改變圖像的表示形式,使得圖像更容易理解和分析。圖像分割通常用於定位圖像中的物體和邊界(線、曲線等)。
Ex:分析車子周圍的各種物件,並保持安全距離(運用於自動駕駛等。)

Pose Estimation(姿態估計)

利用某種幾何模型或結構來表示物體的結構和形狀,並通過提取某些物體特徵,在模型和圖像之間建立起對應關係,然後通過幾何或者其它方法實現物體空間姿態的估計。這裡所使用的模型既可能是簡單的幾何形體,如平面、圓柱,也可能是某種幾何結構。來源

Multiple Object Tracking(視頻跟踪)

視頻跟踪是使用相機隨時間定位移動物體的過程。它有多種用途,其中包括:人機交互,安全和監控,視頻通信和壓縮,增強現實,交通控制,醫學成像和視頻編輯。

Image Generation(影像生成)

根據描述生成逼真的圖像非常困難,並且需要多年的圖形設計培訓。 在機器學習中,這是一個生成任務,比判別任務更具挑戰性。參考

後記

如果想要做自動駕駛,那你就需要 image segmentation 來幫助你判斷圖片中 哪裡是路 哪裡是路人 哪裡是前車。

如果你想要做美圖修修的app 那你就需要style transfer 來幫你用圖片做濾鏡,所以其實常常input是圖片的狀況很多。

以上前面提到的DNN(Deep Neural Network, 深度學習)無法滿足, 你應該會想問 為甚麼不能用DNN呢?DNN不是很厲害什麼都可以解決嗎?

註:本文是搜尋數個網站及各種不同來源之結果,著重在學習,有些內容已難辦別出處,我會儘可能列入出處,若有疏忽或出處不可考,請聯絡我, 我會列入, 尚請見諒。

上一篇
Day 12 - Confusion Matrix 混淆矩陣-模型的好壞 (2)
下一篇
Day 14 - 神經網絡(D)NN 到 卷積神經網絡CNN (1)
系列文
AI 高中生的自我學習30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言