為什麼要做特徵工程呢?
特徵工程是什麼?
特徵工程怎麼做?
參考機器學習馬拉松 017 特徵工程簡介說明,
例如在時間管理中,如何將事情排列優先順序,
我們可以根據事情的重要、緊急程度和所需時間等等,
最後來排列事情的優先順序,如下圖。
特徵工程是事實對應到後續評估分數的轉換
以下將特徵分為四類:
特徵個數越多,分析特徵、訓練模型所需的時間就越長。
特徵個數越多,容易引起“维度災難”,模型也会越複雜,其推廣能力會下降。
數據預處理完成之後,我們需要選擇有意義的特徵,輸入機器學習和模型訓練。
參考特征工程到底是什么?文章,
在程式語法中,特徵⼯工程位於,「資料彙整之後,以及訓練模型之前」:
特徵工程是為了標準化與縮小資料量,
這樣不僅能更符合預測,
對模型訓練也更有效率。
以上,打完收工。