分類(Classification)為預估模型常用的方法,在 Azure Machine Learning Studio 中的分類演算法依據結果類別數量,分成二元分類(Two-Class)及多元分類(Multiclass)
位置:Machine Learning / Initialize Model / Classification
【Dataset】新增資料集:Iris Two Class Data 鳶尾花二元分類資料集
詳細資料說明可參考 UCI Mahchine Learning Repositury - Iris Data Set
【Split Data】設定比例為 0.7:70% 訓練集、30% 測試集
【Train Model】訓練模型:設定要預測的目標欄位 - Class 類別
【Classification】演算法:Two-Class Boosted Decision Tree 二元分類提升決策樹
【Score Model】計分模型:執行預測
預測結果
前 5 個欄位是原資料,第 6 個欄位是預估的類別值,最後一欄是資料為類別 1 的機率。例如:第一筆資料為類別 1 的機率為 0.032258,如果機率 > 0.5 會預測為類別 1,若 機率 < 0.5 則預測為類別0,所以第一筆預測為類別 0
【Dataset】新增資料集:Adult Census Income Binary Classification dataset Census Income dataset 成人收入調查的二元分類資料
詳細資料說明可參考 UCI Mahchine Learning Repositury - Adult Data Set
【Split Data】設定比例為 0.7:70% 訓練集、30% 測試集
【Train Model】訓練模型:設定要預測的目標欄位 - income 收入
【Classification】演算法:Two-Class Logistic Regression 二元分類邏輯迴歸
【Score Model】計分模型:執行預測
預測結果
前半部欄位是原資料,income 欄位是收入實際值,Scored Labels 是收入預估值,最後一欄是收入為 >50K 的機率。例如:第一筆資料收入為 >50K 的機率為 0.132265,如果機率 > 0.5 會預測收入 >50K ,若機率 < 0.5 則預測收入 <=50K,所以第一筆預測收入 <=50K