特徵精準分三等級
1.原始數據:由目前的原始數據,嘗試找出關鍵特徵,有一點測試的意味,trial and error。
2.專業知識:依照領域專家的知識,在知識的基礎下,嘗試時列出關鍵特徵。
3.專家見解:依照目的,由專家提供特別的見解,客製化地列出關鍵特徵。
這麼多的特徵,那些特徵features 是重要? 根據不同的狀況,策略如下(wiki)
Filter method :
Wrapper method
Embedded method
依據 Y 的特性
Supervised Learning : 例如由天氣的資料(X) 決定棒球賽是否舉行(Y)
Unsupervised Learning : 例如由影像個體辨識