iT邦幫忙

2023 iThome 鐵人賽

DAY 28
0
AI & Data

嘗試在AI世界闖蕩系列 第 28

Day 28 AI的核心應用:電腦的聽覺與視覺(圖像分析/分類/分割/定位、物件偵測)

  • 分享至 

  • xImage
  •  

圖像分析

處理黑白辨識➜透過由黑到白0~255級來處理,因為它只會處理數字與矩陣來做計算。
處理色彩辨識➜由三原色利用三維0~255向量來表示項素顏色。
https://ithelp.ithome.com.tw/upload/images/20231009/20163102NWebOUCfBb.png
資料來源:https://hwshow-ipc.blogspot.com/2016/01/04362383-hw5.html

圖像分類Image Classification

透過特徵提取與比對來預測物件的正確類別。

  • 主要數據集:史丹佛大學的Image Net、微軟的COCO、Google Open Image與其他各領域專門蒐集圖像。
  • 主要CNN架構:AlexNet 8層,GoogleNet 22層,VCGNet 16層,ResNet 152層,DenseNet 層

圖像分割Image Segmentation

將整個圖像進行分割,相似紋理、亮度、顏色的像素集合在一起,分成Pixel Set,提取不同物件的輪廓,來界定像素集彼此之間的界線、差異與關係。
https://ithelp.ithome.com.tw/upload/images/20231009/20163102gd65HQu2Y0.jpg
資料來源:https://imgtec.eetrend.com/blog/2019/100016983.html

圖像定位Image Localization

利用邊界框Bounding Box的方式將物件框起來,在圖像分類的基礎上找到目標物的中心點在圖像內的哪個位置。
https://ithelp.ithome.com.tw/upload/images/20231009/20163102J2j0kEXhwF.png
資料來源:https://imgtec.eetrend.com/blog/2019/100016983.html

物件偵測Object Detection(OD)

集合了圖像分割、圖像定位與圖像辨識。
分為
➊滑動窗口法Slide Window Method
在訓練過程中,對輸入圖像利用設計好大小不同的窗口,不斷滑動利用CNN濾境功能執行圖像分類預測,依所得到分類預測最高分,認定該窗口存在那些物件。
特色:不適用及時偵測物件、地毯式全面掃描、沒有目標性

➋選擇性搜尋法Selective Search Method(SSM)
主要精神為物以類聚(相同區塊物件存在某種相似性與連續性)。
步驟:1.在輸入圖像中進行圖像分割,產生許多小區塊 2.計算小區域的相似度,將特徵最相似的小區域不斷整合起來,成為一個大區域的物件輪廓,最後再利用各種不同的CNN演算法來偵測不同區域內的物件種類為何

模型架構:
➊兩階段的物件偵測架構Two Stage

  • 用選擇性搜尋法(SSM)不斷去整合各種相似性高、可能有物件存在的預選區域(RP),接著再用CNN對RP可能存在的物件進行分類的判斷。
  • 主要模型:R-CNN、Fast R-CNN、Faster R-CNN

➋一階段的物件偵測架構One Stage

  • 用CNN在圖像中直接提取特徵,同時預測物件的數量、位置與分類。
  • 主要模型:YOLOv1、YOLOv2、YOLOv3、YOLOv4

參考來源:人工智慧:概念應用與管理 林東清


上一篇
Day 27 AI的核心應用:電腦的聽覺與視覺(TTS、、Real Time Voice Cloning、CV)
下一篇
Day 29 AI的核心應用:電腦的聽覺與視覺(R-CNN、YOLO)
系列文
嘗試在AI世界闖蕩31
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言