若資料集中的兩個特徵值關係或特徵值與某一常數值關係有可能影響結果,那我們可以透過 Apply Math Operation 中的 Compare 及 Operations 運算後的結果建立新的特徵值,加入建模。
運算的方式有兩種:
Compare 比較運算有以下 8 種比較方式:
(1) 以汽車價格資料集為例,為了方便檢視結果,先篩選出兩個要比較的欄位就好,新增"Select Columns in Dataset" 選擇資料集欄位,將資料集的輸出接至 Select Columns in Dataset,點選右手邊的"Launch column selector" 開啟欄位選擇工具
(2) 選擇 bore 氣缸孔徑、stroke 衝程這兩個欄位,點選右下角勾勾確認
(3) 執行 Select Columns in Dataset,輸出的資料集內容會只剩下bore、stroke兩個欄位
(4) 新增"Apply Math Operation",將 Select Columns in Dataset 的輸出接至 Apply Math Operation,類型選擇 Campare 比較、方法選擇 Greater Than 大於、比較對象選擇 ColumnSet 資料欄位,點選"Launch column selector"開啟欄位選擇工具
(5) 若是比較兩個欄位,要注意的是第一個欄位 value to compare 是放比較對象(也就是被比較的值)、第二個欄位是放要比較的值,Ex:選大於、第一欄放A、第二欄放B,結果會是B>A的布林值。這邊選擇 bore 當比較對象
(6) 再來選擇要比較的欄位
(7) 選擇 stroke 欄位,點選右下角勾勾確認
(8) 選擇加入新欄位顯示結果
(9) 比較兩欄位的結果會以布林值顯示
(10) 這邊試了幾個比較運算的結果如下
Operations 有以下 4 種運算:
操作步驟與 Compare 相同,這邊直接放幾個 Operations 運算的結果如下