iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 9
0
Everything on Azure

Azure Machine Learning Studio系列 第 9

Azure Machine Learning Studio 資料前處理 - 計算基礎統計 Compute Elementary Statistics

在 Azure Machine Learning Studio 中,可以透過 Compute Elementary Statistics 來計算資料的統計值,像是平均值、標準差、中位數等等,可以用來分析資料的集中趨勢、分散情況。

Compute Elementary Statistics 計算基礎統計

位置:Statistical Functions / Compute Elementary Statistics
Compute Elementary Statistics 計算基礎統計包含以下方法:

  1. Deviation squared 平方差
  2. Geometric mean 幾何平均數
  3. Harmonic mean 調和平均數
  4. Interquartile distance 四分位數
  5. k-th central moment k階中央動差
  6. Max 最大值
  7. Mean 平均數
  8. Mean deviation 平均差
  9. Median 中位數
  10. Median deviation 中位差
  11. Min 最小值
  12. Mode 眾數
  13. Population standard deviation 總體標準差
  14. Population variance 總體變異數
  15. Product 乘積
  16. Range 範圍
  17. Sample kurtosis 峰度
  18. Sample skewness 偏度
  19. Sample standard deviation 總體標準差
  20. Sample variance 樣本變異數
  21. Sum 總和

https://ithelp.ithome.com.tw/upload/images/20181021/20111935n3opNKm5lQ.png

(1)新增成人收入調查的二元分類資料集,再來新增 Select Columns in Dataset 選取要計算的欄位,點選右手邊 Launch column selector 開啟欄位選擇工具
https://ithelp.ithome.com.tw/upload/images/20181021/20111935GC6zlsQNwM.png

(2)選擇 age 年齡欄位,點選右下角勾勾確認
https://ithelp.ithome.com.tw/upload/images/20181021/20111935uG1LnH7KfV.png

(3) 執行後,資料集會篩選剩下 age 年齡欄位
https://ithelp.ithome.com.tw/upload/images/20181021/20111935PiTlSgqOom.png

(4) 新增"Compute Elementary Statistics"計算基礎統計,將資料集輸出接至 Compute Elementary Statistics ,方法選擇 Max 最大值,點選 Launch column selector 開啟欄位選擇工具
https://ithelp.ithome.com.tw/upload/images/20181021/20111935jKr7iRJ24h.png

(5) 選擇 age 年齡欄位,點選右下角勾勾確認
https://ithelp.ithome.com.tw/upload/images/20181021/20111935pKmsGM1O05.png

(6) 執行此計算
https://ithelp.ithome.com.tw/upload/images/20181021/20111935m4zufFVdOQ.png

(7) 執行後可以看到 age 年齡的最大值是 90
https://ithelp.ithome.com.tw/upload/images/20181021/2011193570cl3Jnbtp.png

要特別注意的是,跟其他運算功能不一樣,Compute Elementary Statistics 計算完的結果無法選擇 Append 的方式加到新欄位,他只會留下結果欄位,這時候可以搭配 Add Columns 或 Add Rows 的功能,合併統計後的結果,操作方式如下:

搭配 Add Columns 新增欄位 彙總資料統計結果

(1) 新增其他多個 Compute Elementary Statistics 來計算不同的統計資料,接著將計算後的結果接至 Add Columns,就可以合併所需要的統計資料
https://ithelp.ithome.com.tw/upload/images/20181022/20111935Xezc0TdWM3.png

(2) 下方為最後合併的結果,分別計算了 age 年齡的最大值、平均數、中位數
https://ithelp.ithome.com.tw/upload/images/20181022/201119359ivSj4u2QI.png


上一篇
Azure Machine Learning Studio 資料前處理 - 數學運算 Apply Math Operation (3) Rounding、Special、Trigonometric
下一篇
Azure Machine Learning Studio 特徵篩選 Filter-Based Feature Selection
系列文
Azure Machine Learning Studio30

尚未有邦友留言

立即登入留言