iT邦幫忙

2022 iThome 鐵人賽

DAY 2
0

2022/9/16(五): D2-資料集整理&基準模型設計

Part1:今日目標

1.將下載完畢的訓練資料做整理。
2.基準模型搜尋和流程規劃。


Part2:內容

1.將下載完畢的訓練資料做整理。

(1)各類別資料集解壓縮(程式自動化解壓縮,共33個壓縮檔)

(2)探索式資料分析(EDA, Exploratory Data Analysis)

  • 各類別圖片數量,確認資料集數量是否平衡。
  • 各類別有準心資訊圖片資料佔總數之比例,若數量沒有太少,考慮先將這些圖片用準心做圖片切割,作為基準模型(baseline)的訓練資料。
  • 圖片大小差異,記錄相關特徵,以規劃後續資料前處理能採用哪些策略。

2.基準模型搜尋和流程規劃

(1)模型選擇: Google搜尋適用的Pytorch Pretrained Model (多類別影像辨識),首選輕量型模型,以取得初步結果作後續優化的基準比較值。

(2)訓練資料: 用準心裁切的訓練集圖片。

  • 後續:參考D1筆記用深度學習網路,讓模型自動學習偵測目標物於圖片的所在位置(無準心訓練圖片)。

3.專案進度

  • 第一階段訓練資料下載完畢
  • 實作程式,共2支:
    • 自動化解壓縮
    • EDA訓練資料集

4.備註:

  • 程式碼後續會統一放到Github上,後續文章將放上連結。
心得小語:
近期上班太常持續盯螢幕9~18(會議較少都在實作),下班後只覺得頭昏眼花 QQ
但鐵人賽強迫自己在下班後繼續進修,幸好馬上迎來周末(呼~~) 能調整步伐,喘息一下再繼續跟上大家的腳步啦~!
今日工時: 50min*3

吃飽睡好,享受周末! /images/emoticon/emoticon37.gif
Eat well and Sleep well, Enjoy a wonderful WEEKEND!!


上一篇
D1-熟悉資料集&專案目標
下一篇
D3-資料集前處理1st
系列文
菜鳥工程師第一個電腦視覺(CV)專案-農作物影像辨識競賽32
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言