2022/9/16(五): D2-資料集整理&基準模型設計
Part1:今日目標
1.將下載完畢的訓練資料做整理。
2.基準模型搜尋和流程規劃。
Part2:內容
1.將下載完畢的訓練資料做整理。
(1)各類別資料集解壓縮(程式自動化解壓縮,共33個壓縮檔)
(2)探索式資料分析(EDA, Exploratory Data Analysis)
- 各類別圖片數量,確認資料集數量是否平衡。
- 各類別有準心資訊圖片資料佔總數之比例,若數量沒有太少,考慮先將這些圖片用準心做圖片切割,作為基準模型(baseline)的訓練資料。
- 圖片大小差異,記錄相關特徵,以規劃後續資料前處理能採用哪些策略。
2.基準模型搜尋和流程規劃
(1)模型選擇: Google搜尋適用的Pytorch Pretrained Model (多類別影像辨識),首選輕量型模型,以取得初步結果作後續優化的基準比較值。
(2)訓練資料: 用準心裁切的訓練集圖片。
- 後續:參考D1筆記用深度學習網路,讓模型自動學習偵測目標物於圖片的所在位置(無準心訓練圖片)。
3.專案進度
4.備註:
- 程式碼後續會統一放到Github上,後續文章將放上連結。
心得小語:
近期上班太常持續盯螢幕9~18(會議較少都在實作),下班後只覺得頭昏眼花 QQ
但鐵人賽強迫自己在下班後繼續進修,幸好馬上迎來周末(呼~~) 能調整步伐,喘息一下再繼續跟上大家的腳步啦~!
今日工時: 50min*3
吃飽睡好,享受周末!
Eat well and Sleep well, Enjoy a wonderful WEEKEND!!