iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 6
0
Everything on Azure

Azure Machine Learning Studio系列 第 6

Azure Machine Learning Studio 資料前處理 - 數學運算 Apply Math Operation (1) 基礎 Basic

在 Azure Machine Learning Studio 中,Statistical Functions 統計函數包含了許多運算方法,可以針對現有的資料進行函數運算後,將之視為一個新的特徵值,加入資料集內,或直接取代原有特徵值,以加強模型,另外也可以透過統計函數來檢視資料集的狀態,或驗證資料處理的結果。

Statistical Functions 統計函數有以下 7 種:

  1. Apply Math Operation 數學運算
  2. Compute Elementary Statistics 計算基礎統計
  3. Compute Linear Correlation 計算線性相關
  4. Evaluate Probability Function 評估機率函數
  5. Replace Discrete Values 替換離散值
  6. Summarize Data 彙總資料
  7. Test Hypothesis using t-Test 統計假設檢定

https://ithelp.ithome.com.tw/upload/images/20181019/201119350JU5iTT2a2.png

Apply Math Operation 數學運算

位置:Statistical Functions / Apply Math Operation
Apply Math Operation 數學運算包含以下 6 種:

  1. Basic 基礎
  2. Compare 比較
  3. Operations 運算
  4. Rounding 四捨五入
  5. Special 特殊
  6. Trigonometric 三角函數

https://ithelp.ithome.com.tw/upload/images/20181019/20111935eDR0HxfcZC.png

數學運算後的結果處理,有以下 3 種:

  1. Append 加入為新欄位
  2. Inplace 取代原有欄位
  3. ResultOnly 只留下運算結果欄位

https://ithelp.ithome.com.tw/upload/images/20181019/201119353jIPq5VrwJ.png

Basic 基礎運算

  • Abs 絕對值
  • Atan2 反正切三角函數
  • Conj 共軛函數
  • CubeRoot 立方根
  • DpubleFactorial 雙階乘(n!!)
  • Eps 最小浮點數精度
  • Exp 以e為基底的指數
  • Exp2 以2為基底的指數
  • ExpMinus1 負指數
  • Factorial 階乘(n!)
  • Hypotenuse 三角函數斜邊計算
  • ImaginaryPart 複數的虛數部分
  • Ln 一個數的自然對數
  • LnPlus1 Ln(X+1)
  • Log 對數函數
  • Log10 以10為底的對數函數
  • Log2 以2為底的對數函數
  • NthRoot 開根號
  • Pow 次方
  • RealPart 複數的實數部分
  • Sqrt 平方根
  • SqrtPi 乘 π 開根號
  • Square 平方

https://ithelp.ithome.com.tw/upload/images/20181019/20111935QcOPbzoTih.png

Apply Math Operation - Basic 基礎運算

(1) 以鳶尾花分類資料集為例,新增"Apply Math Operation"數學運算,將資料集輸出接至 Apply Math Operation 的輸入,選擇 Basic 基礎運算,選擇運算函式 cuberoot 開立方根,接著選擇要做運算的欄位
https://ithelp.ithome.com.tw/upload/images/20181019/20111935l5hVwEkHjo.png

(2) 這裡選擇 sepal-length 花萼長度,點選右下角勾勾確認
https://ithelp.ithome.com.tw/upload/images/20181019/20111935XGKUAB3ypz.png

(3) 選擇運算結果處理方式 Append 加入新欄位,點選 Run 執行
https://ithelp.ithome.com.tw/upload/images/20181019/20111935GGswPcuMqo.png

(4) 執行完成,可以點選滑鼠右鍵檢視結果
https://ithelp.ithome.com.tw/upload/images/20181019/20111935IS6TqlcrlA.png

(5) 可以看到運算結果被加在最後一個欄位 Cubroot(sepal-length)
https://ithelp.ithome.com.tw/upload/images/20181019/20111935xAgeWxtsg8.png

(6) 其他的函數也是類似作法,這邊針對相同欄位 sepal-length 花萼長度試了幾個不同的基礎運算的結果如下
https://ithelp.ithome.com.tw/upload/images/20181019/20111935XwANWIuGeE.png


上一篇
Azure Machine Learning Studio 資料前處理 - 重複值 Remove Duplicate Rows、離群值 Clip Values
下一篇
Azure Machine Learning Studio 特徵篩選 Filter-Based Feature Selection
系列文
Azure Machine Learning Studio30

尚未有邦友留言

立即登入留言