iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 19
0
Everything on Azure

Azure Machine Learning Studio系列 第 19

Azure Machine Learning Studio 分類 - 二元分類 Two-Class Classification

  • 分享至 

  • xImage
  •  

分類(Classification)為預估模型常用的方法,在 Azure Machine Learning Studio 中的分類演算法依據結果類別數量,分成二元分類(Two-Class)及多元分類(Multiclass)

Classification 分類

位置:Machine Learning / Initialize Model / Classification

  1. Two-Class 二元分類
    • Two-Class Averaged Perception
    • Two-Class Bayes Point Machine
    • Two-Class Boosted Decision Tree
    • Two-Class Decision Forest
    • Two-Class Decision Jungle
    • Two-Class Locally-Deep Support Vector Machine
    • Two-Class Logistic Regression
    • Two-Class Neural Network
    • Two-Class Support Vector Machine
  2. Multiclass 多元分類
    • Multiclass Decision Forest
    • Multiclass Decision Jungle
    • Multiclass Logistic Regression
    • Multiclass Neural Network
    • One-vs-All Multiclass

https://ithelp.ithome.com.tw/upload/images/20181101/20111935UR91dMBpdV.png

二元分類範例

【範例 1】以二元分類提升決策樹演算法預估鳶尾花類別

  1. 【Dataset】新增資料集:Iris Two Class Data 鳶尾花二元分類資料集
    詳細資料說明可參考 UCI Mahchine Learning Repositury - Iris Data Set

    • 特徵(Feature):萼片長度(sepal-length)、萼片寬度(sepal-width)、花瓣長度(petal-length)、花瓣寬度(petal-width)
    • 標籤(Label):類別(Class)
      https://ithelp.ithome.com.tw/upload/images/20181101/20111935kSb7uXAuD0.png
  2. 【Split Data】設定比例為 0.7:70% 訓練集、30% 測試集
    https://ithelp.ithome.com.tw/upload/images/20181101/20111935L70jMvqXsr.png

  3. 【Train Model】訓練模型:設定要預測的目標欄位 - Class 類別

  4. 【Classification】演算法:Two-Class Boosted Decision Tree 二元分類提升決策樹
    https://ithelp.ithome.com.tw/upload/images/20181101/20111935bCyoGHW8ve.png

  5. 【Score Model】計分模型:執行預測
    https://ithelp.ithome.com.tw/upload/images/20181101/20111935GjBLTaA6yb.png

  6. 預測結果
    前 5 個欄位是原資料,第 6 個欄位是預估的類別值,最後一欄是資料為類別 1 的機率。例如:第一筆資料為類別 1 的機率為 0.032258,如果機率 > 0.5 會預測為類別 1,若 機率 < 0.5 則預測為類別0,所以第一筆預測為類別 0
    https://ithelp.ithome.com.tw/upload/images/20181101/20111935VlUv4bytkG.png

【範例 2】以二元分類邏輯迴歸演算法預估成人收入是否大於 50 K

  1. 【Dataset】新增資料集:Adult Census Income Binary Classification dataset Census Income dataset 成人收入調查的二元分類資料
    詳細資料說明可參考 UCI Mahchine Learning Repositury - Adult Data Set

    • 特徵(Feature):年齡(age)、工作類別(workclass)、fnlwgt、學歷(education)、學歷數值資料(education-num)、婚姻狀態(marital-status)、產業類別(occupation)、家庭成員(relationship)、種族(race)、性別(sex)、capital-gain、capital-loss、每週工時(hours-per-week)、國籍(native-country)
    • 標籤(Label):收入(income)
      https://ithelp.ithome.com.tw/upload/images/20181101/20111935zOt85o1sUG.png
  2. 【Split Data】設定比例為 0.7:70% 訓練集、30% 測試集
    https://ithelp.ithome.com.tw/upload/images/20181101/2011193510gqluzLKe.png

  3. 【Train Model】訓練模型:設定要預測的目標欄位 - income 收入

  4. 【Classification】演算法:Two-Class Logistic Regression 二元分類邏輯迴歸
    https://ithelp.ithome.com.tw/upload/images/20181101/20111935Xdu8AoiVcX.png

  5. 【Score Model】計分模型:執行預測
    https://ithelp.ithome.com.tw/upload/images/20181101/20111935mlPV9Zchp4.png

  6. 預測結果
    前半部欄位是原資料,income 欄位是收入實際值,Scored Labels 是收入預估值,最後一欄是收入為 >50K 的機率。例如:第一筆資料收入為 >50K 的機率為 0.132265,如果機率 > 0.5 會預測收入 >50K ,若機率 < 0.5 則預測收入 <=50K,所以第一筆預測收入 <=50K
    https://ithelp.ithome.com.tw/upload/images/20181101/20111935uIg1SpGnts.png


上一篇
Azure Machine Learning Studio 演算法比較 - 評估模型 Evaluate Model
下一篇
Azure Machine Learning Studio 分類 - 多類別分類 Multiclass Classification
系列文
Azure Machine Learning Studio30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言