iT邦幫忙

2022 iThome 鐵人賽

DAY 1
0

Part1:今日目標

1.瀏覽資料集,註記資料特徵
2.網路上相關專案實作資訊蒐集
3.專案進度


Part2:內容

1.瀏覽資料集,註記資料特徵

(1)題目: 對圖片影像做分類,共33類


圖片來源:AIdea

  • 每種類別的圖片數量是否差不多,還是有資料不平衡的問題?
  • 資料量很大(170GB),先抽樣部分圖片訓練出baseline結果,後續再進一步優化。

(2)資料集樣態


圖片來源:AIdea

  • 若準心座標為(0, 0),則為"無準心"。
  • 作物佔整張圖片很小部分,要先做圖片裁切,避免模型訓練時吃進太多雜訊。
  • 標籤為"非作物"的圖片有很多類(欄杆、休耕、飼養場所)。

(3)以「asparagus蘆筍」資料夾為例:


  • 圖片幾乎都是草.. 用肉眼幾乎看不出來,也沒有果實可輔助判斷(所以才需要AI XD /images/emoticon/emoticon08.gif
  • 圖片名稱為亂數沒有規律,但有產地位置(country & town)也許能協助模型判斷。

    圖片來源:AIdea

2.網路上相關專案實作資訊蒐集

  • 影像辨識流程:
影像輸入 > 資料前處理 > 切割 > 辨識分類模型
  • 資料前處理:
    • 灰階化: 辨別文字,不應受文字色彩影響。
    • 去雜訊: 亮度對比、濾波器、去除噪點。
    • 補點: 補足因去雜訊所造成資料缺陷。
  • 圖片裁切: (輪廓、擷取、正規化)
    • OpenCV: 給定要裁切區域(適用:有準心位置的圖片)。推薦:Open CV操作筆記
    • 區域候選網路: 讓神經網路自動偵測要裁切的區域(適用:沒有準心的圖片)。
  • Faster R-CNN:
    • CNN: 進行特徵抽取。
    • 區域候選網路: 偵測物體所在位置。
    • 全連接層&Softmax: 目標物分類。

3.專案進度

  • 資料集下載一半。
    今日工時: 50min*3

千里之行,始於足下
A journey of a thousand miles begins with a single step.


下一篇
D2-資料集整理&基準模型規劃
系列文
菜鳥工程師第一個電腦視覺(CV)專案-農作物影像辨識競賽32
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言