Part1:今日目標
1.瀏覽資料集,註記資料特徵
2.網路上相關專案實作資訊蒐集
3.專案進度
Part2:內容
1.瀏覽資料集,註記資料特徵
(1)題目: 對圖片影像做分類,共33類
圖片來源:AIdea
- 每種類別的圖片數量是否差不多,還是有資料不平衡的問題?
- 資料量很大(170GB),先抽樣部分圖片訓練出baseline結果,後續再進一步優化。
(2)資料集樣態
圖片來源:AIdea
- 若準心座標為(0, 0),則為"無準心"。
- 作物佔整張圖片很小部分,要先做圖片裁切,避免模型訓練時吃進太多雜訊。
- 標籤為"非作物"的圖片有很多類(欄杆、休耕、飼養場所)。
(3)以「asparagus蘆筍」資料夾為例:
- 圖片幾乎都是草.. 用肉眼幾乎看不出來,也沒有果實可輔助判斷(所以才需要AI XD
- 圖片名稱為亂數沒有規律,但有產地位置(country & town)也許能協助模型判斷。
圖片來源:AIdea
2.網路上相關專案實作資訊蒐集
影像輸入 > 資料前處理 > 切割 > 辨識分類模型
- 資料前處理:
- 灰階化: 辨別文字,不應受文字色彩影響。
- 去雜訊: 亮度對比、濾波器、去除噪點。
- 補點: 補足因去雜訊所造成資料缺陷。
- 圖片裁切: (輪廓、擷取、正規化)
- OpenCV: 給定要裁切區域(適用:有準心位置的圖片)。推薦:Open CV操作筆記
- 區域候選網路: 讓神經網路自動偵測要裁切的區域(適用:沒有準心的圖片)。
- Faster R-CNN:
- CNN: 進行特徵抽取。
- 區域候選網路: 偵測物體所在位置。
- 全連接層&Softmax: 目標物分類。
3.專案進度
千里之行,始於足下
A journey of a thousand miles begins with a single step.