哈囉大家好,我是橘白卯咪,歡迎大家來看看我能不能撐過30天
今天要講的主題,對於特徵資料的預處理,每個案例都會採用不同的方法
所以我以第11天所介紹的這個系統為例,介紹給大家 原作者的報告
除了幫大家簡單翻成比較好入口的文字而且是中文之外
個人私心也想好好再看一次這部分
先來簡單複習一下資料預處理
(摘要自滿簡明易懂的文章
資料預處理分為以下三種
如果資料量夠多可以直接丟棄,不夠的話就補值。常見補值方式有補固定值、平均值、眾數、中位數。
有序、無序資料
分為Normalization、Standardization(標準化)兩種方式
先講結論,作者使用到 資料特徵縮放、先部分移除後補值 的方法
以下引文的部分翻譯自作者,整個特徵預處理共有4個步驟:
- 調整座標比例
openpose 原始輸出的關鍵點位置,x,y座標跟一般的不同,所以調整了比例,使得不同長寬比的圖片一致
- 移除所有的頭部節點
原本openpose的輸出上,屬於頭部的部分,有1個頭、2個眼睛和2個耳朵的關鍵點。因頭部的動作對於訓練的資料集作用不大,重點在軀幹與四肢的動態
這點作者在readme當中也有說明,如果不要移除的話應該怎麼做
個人覺得因適用場景而異,在我實際觀察到的行為當中,尤其是判斷行為的投入,頭部的動態具有很重要的訊息
- 移除沒有大腿或頸部的影像
如果影像中沒有被openpose偵測到的關鍵點,或骨架沒有頸或大腿,則會被認為是無效的影像。滑動視窗也會在下一幀重新初始化
這可能是減少無效資訊的一種方式,但有時候骨架沒有頸或大腿,不是影像的問題而是openpose大大沒抓到啊~
- 補充遺失的關鍵點
在某些狀況下,openpose可能沒有偵測到完整的骨架,故需要補齊。採用骨架的相對位置來補齊對應的關鍵點
作者也提出兩個他認為較為不好的預處理方法
- 丟棄該幀影像
然而,有些人的行為無法識別的原因,是因為該人沒有面對鏡頭- 回填的位置不在合理範圍
實驗的結果不好,所以不採用這種方法
資料預處理的方法因應用、資料不同有所差異
但在剛開始著手的時候,參考別人的作法可以獲得一些解決眼前問題的想法
明天來說說特徵萃取方法之一的PCA(主成分分析法)!