iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 13
0
Google Developers Machine Learning

Machine Learning Day30系列 第 13

[Day13]特徵工程介紹

為什麼要做特徵工程呢?
特徵工程是什麼?
特徵工程怎麼做?

特徵工程

參考機器學習馬拉松 017 特徵工程簡介說明,
例如在時間管理中,如何將事情排列優先順序,
我們可以根據事情的重要、緊急程度和所需時間等等,
最後來排列事情的優先順序,如下圖。

特徵工程是事實對應到後續評估分數的轉換

以下將特徵分為四類:

特徵個數越多,分析特徵、訓練模型所需的時間就越長。
特徵個數越多,容易引起“维度災難”,模型也会越複雜,其推廣能力會下降。
數據預處理完成之後,我們需要選擇有意義的特徵,輸入機器學習和模型訓練。

使用時機

參考特征工程到底是什么?文章,
在程式語法中,特徵⼯工程位於,「資料彙整之後,以及訓練模型之前」:

工程結構圖


特徵工程是為了標準化與縮小資料量,
這樣不僅能更符合預測,
對模型訓練也更有效率。


以上,打完收工。


上一篇
[Day12]訓練模型-避免overfit
下一篇
[Day14] 數據前處理EDA
系列文
Machine Learning Day3026
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言