4. Discretization(分隔方法 or 離散化) 4.1 Equal width discretisation4.2 Equal Frequency...
Discretization(分隔方法 or 離散化)4.1 Equal width discretisation(等寬離散化)4.2 Equal Frequ...
Discretization(分隔方法 or 離散化)4.1 Equal width discretisation(等寬離散化)4.2 Equal Frequ...
5. Outlier 由於資料收集測量方法的變異、人為的疏失或是實驗誤差,在資料集中一個數值與其他數值相比差異非常大,我們稱這個數值為異常值(Outlier)。...
5. Outlier 5.1 Outlier detection and removal(異常值偵測和移除)5.2 Treating outliers as m...
5. Outlier 5.1 Outlier detection and removal(異常值偵測和移除)5.2 Treating outliers as m...
6. Feature Scaling 通常資料集特徵下的資料數值多分布在不同的範圍,這對依賴距離(distance)來進行機器學習的演算法而言是一大問題,因此依...
正規化的方法:6.1 Standardisation(標準化)6.2 Min-Max Scaling6.3 Maximum Absolute Scaling6....
7. Date and Time Engineering 許多資料集都會有日期和時間特徵,它們是一個重要的欄位,妥善的處理它們,可以幫助機器模型加快學習和作出較...
7. Date and Time Engineering(2)和時間序列 7.1 Date and Time Engineering7.2 Feature En...