iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 20
0
AI & Data

特徵工程 in 30 days系列 第 21

[改善資料品質]Part-3 多項式特徵

生成多項式和交互功能。

生成一個新的特徵矩陣,該特徵矩陣由度數小於或等於指定度數的特徵的所有多項式組合組成。例如,如果輸入樣本是二維的並且形式為[a,b],則2次多項式特徵是[1,a,b,a ^ 2,ab,b ^ 2]。請注意,輸出數組中的要素數量在輸入數組的要素數中按比例縮放,並在度數上呈指數級。高度可能導致過度擬合。

n_output_features_ : int
The total number of polynomial output features. The number of output features is computed by iterating over all suitably sized combinations of input features.
輸出多項式的特徵個數。它的計算是通過遍歷所有的適當大小的輸入特徵組合。

note:Be aware that the number of features in the output array scales polynomially in the number of features of the input array, and exponentially in the degree. High degrees can cause overfitting.
注意:請注意,輸出數組中的要素數量在輸入數組的要素數中按比例縮放,並在度數上呈指數級。高度可能導致過度擬合。

#Work in progress will update soon


上一篇
[改善資料品質]Part-3 建構新的表徵-將連續型數字類別編碼為類別
下一篇
[特徵選擇]intro
系列文
特徵工程 in 30 days23

1 則留言

0
若虛
iT邦新手 5 級 ‧ 2018-10-24 00:04:07

加油加油!/images/emoticon/emoticon76.gif

我要留言

立即登入留言